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@ VECTEURS RECOMBINANTS, POLYNUCLEOTIDE CODANT POUR UN POLYPEPTIDE PD428 DE 12KD DE 
MYCOBACTERIES APPARTENANT AU COMPLEXE DE MYCOBACTERIUM TUBERCULOSIS ET 
APPLICATIONS AU DIAGNOSTIC ET A LA PREVENTION DE LA TUBERCULOSE. 



(5y L'invention a pour objet de nouveaux vecteurs recom- 
binants se replicant chez les mycobacteries, des proc6d6s 
de criblage incluant lesdits vecteurs, des polypeptides, dont 
le polypeptide DP428, et leur sequence nucl6ique, corres- 
pondant a des polypeptides exportes retrouves dans les 
mycobacteries appartenant au complexe de Mycobacterium 
tuberculosis. 

L'invention conceme 6galement des proc6d6s et des 
kits de detection de mycobacteries appartenant au comple- 
xe de Mycobacterium tuberculosis dans un 6chantillon bio- 
logique utilisant lesdits polypeptides, leurs anticorps 
sp6cifiques ou lesdits polynucleotides, ainsi que des com- 
positions immunogenes ou vaccinales pour la prevention et/ 
ou le traitement defections provoquees par des mycobac- 
teries appartenant audit complexe, en particulier la tubercu- 
losa 



1 



2767336 



Vecteurs recombinants, polynucleotide codant pour un 
polypeptide DP428 de 12kD de mycobacteries appartenant au 
complexe de Mycobacterium tuberculosis et applications au 
diagnostic et a la prevention de la tuberculose. 

5 

L 1 invention a pour objet de nouveaux vecteurs recombinants 
de criblage, de clonage et/ou d f expression se replicant chez 
les mycobacteries. L' invention concerne egalement un 

10 polypeptide, denomme DP428, d 1 environ 12kD correspondant a une 
proteine exportee retrouvee dans les mycobacteries appartenant 
au complexe de Mycobacterium tuberculosis. L 1 invention vise 
aussi un polynucleotide comprenant une sequence codant pour ce 
polypeptide. Elle concerne egalement 1 1 utilisation du 

15 polypeptide ou de fragments de celui-ci et des polynucleotides 
codant pour ces derniers pour la realisation de moyens de 
detection in vitro de la presence d'une mycobacterie 
appartenant au complexe de Mycobacterium tuberculosis dans un 
echantillon biologique. L' invention vise enfin 1 1 utilisation du 

20 polypeptide ou de fragments de celui-ci ainsi que des 
polynucleotides codant pour ces derniers en tant que moyens 
destines a la preparation d'une composition immunogene, 
susceptible d'induire une reponse immunitaire dirigee contre 
les mycobacteries appartenant au complexe de Mycobacterium 

25 tuberculosis, ou d'une composition vaccinale pour la prevention 
et/ou le traitement d' infections provoquees par des 
mycobacteries appartenant audit complexe, en particulier la 
tuberculose . 

30 

Le genre Mycobacterium, qui comprend au moins 56 especes 
differentes, inclut des pathogenes humains majeurs tels que M. 
leprae et M. tuberculosis, les agents responsables de la lepre 
et de la tuberculose, qui restent des problemes graves de sante 
35 publique dans le monde entier. 



2 



2767336 



La tuberculose continue d'etre un probleme de sante 
publique dans le monde. Aujourd'hui, cette maladie est la cause 
de 2 a 3 millions de morts dans le monde et environ 8 millions 
de nouveaux cas sont observes chaque annee (Bouvet, 1994). Dans 
les pays developpes M. tuberculosis est la cause la plus 
commune des infections mycobacteriennes . En France il apparait 
environ 10 000 nouveaux cas par an et parmi les maladies a 
declaration obligatoire c'est la tuberculose qui comprend le 
plus grand nombre de cas. La vaccination par le BCG (Bacille de 
Calmette et Guerin) , une souche avirulente derivee de M. bovis 
et qui est tres utilise comme vaccin centre la tuberculose, est 
loin d'etre efficace au sein de toutes les populations. Cette 
efficacite varie environ de 80% dans les pays occidentaux comme 
l'Angleterre, a 0% en Inde (resultats du dernier essai de 
vaccination a Chingleput., publies en 1972 dans Indian J. Med. 
Res.). De plus, 1 'apparition de souches de M. tuberculosis 
resistantes aux antituberculeux et le risque accru chez les 
patients immunodeprimes , patients atteints du SIDA, de 
developper une tuberculose, rendent necessaire la mise au point 
de methodes rapides, specifiques et fiables pour le diagnostic 
de la tuberculose. Par exemple, une etude epidemiologique 
realisee en Floride, et dont les resultats ont ete publies en 
1993 dans AIDS therapies, a montre que 10% des malades atteints 
de SIDA sont atteint de tuberculose au moment du diagnostic du 
SIDA ou 18 mois avant celui-ci. Chez ces malades, la 
tuberculose apparait dans 60% des cas sous une forme disseminee 
done non reperable par les criteres de diagnostic classiques 
comme la radiographie pulmonaire ou 1- analyse de crachats. 

Actuellement, une certitude sur le diagnostic apporte par 
la mise en evidence de bacilles cultivates dans un prelevement 
provenant du malade n'est obtenue que pour moins de la moitie 
des cas de tuberculose, meme dans les cas de tuberculose 
pulmonaire. Le diagnostic de la tuberculose et des autres 
mycobacteries apparentees est done difficile a realiser, et 
cela pour differentes raisons : les mycobacteries sont souvent 
presentes en faible quantite, leur temps de generation est tres 
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long (24h pour M. tuberculosis) et leur culture est difficile. 
(Bates et al . , 1986) . 

D'autres techniques sont utilisables en clinique, pour 
identifier une infection mycobacterienne : 

a) . L" identification directe des microorganismes au 
microscope; cette technique est rapide, mais ne permet pas 
1' identification de l'espece mycobacterienne observee et manque 
de sensibilite (Bates, 1979) . 

Les cultures, lorsqu'elles sont positives, ont une 
specif icite approchant 100% et permettent 1 ' identification de 
l'espece mycobacterienne isolee; neanmoins, comme precise ci- 
dessus, la croissance des mycobacteries in vitro est longue (ne 
peut etre realisee qu'en 3 a 6 semaines de cultures repetees 
(Bates, 1979; Bates et al . , 1986)) et couteuse. 

b) . Les techniques serologiques peuvent s'averer utiles 
dans certaines conditions, mais leur utilisation est parfois 
limited par leur sensibilite et/ou leur specificite faibles 
(Daniel et al., 1987). 

c) . La presence de mycobacteries au sein d'un echantillon 
biologique peut aussi etre determined par hybridation 
moleculaire avec de l'ADN ou de l'ARN en utilisant des sondes 
d' oligonucleotides specif iques des sequences recherchees 
(Kiehn et al., 1987; Roberts et al., 1987; Drake et al . , 
1987). Plusieurs etudes ont montre l'interet de cette 
technique pour le diagnostic des infections a mycobacteries. 
Les sondes utilisees sont constitutes d'ADN, d'ARN ribosomique 
ou de fragments d'ADN mycobacteriens non caracterises et 
provenant de banque de genes. Le principe de ces techniques 
repose sur le polymorphisme des sequences nucleotidiques des 
fragments utilises ou sur le polymorphisme des regions 
avoisinantes. Dans tons les cas, elles necessitent 
1 "utilisation de cultures et ne sont pas applicables 
directement sur les echantillons biologiques. 

La faible quantite de mycobacteries presentes au sein d'un 
echantillon biologique et en consequence la quantite faible 
d'ADN cible a detecter dans cet echantillon peut necessiter le 
recours a une amplification specif ique in vitro de l'ADN cible 
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avant sa detection a 1 ' aide de la sonde nucleotidique et en 
utilisant des techniques d ' amplification in vitro telles que 
la PCR (amplification en chaine a la polymerase 

L 1 amplification specif ique de l'ADN par la technique PCR 
5 peut constituer la premiere etape d'un procede de detection de 
la presence d'un ADN mycobacterien dans un echantillon 
biologique, la detection proprement dite de l'ADN amplifie 
etant effectuee dans un second temps a l'aide d'une sonde 
oligonucleotidique capable de s'hybrider specif iquement a 1 1 ADN 
10 amplifie . 

Un test de detection de mycobacteries appartenant au 
complexe de Mycobacterium tuberculosis, par hybridation 
sandwich (test utilisant une sonde de capture et une sonde de 
detection) a ete decrit par Chevrier et al . en 1993. le 
15 complexe de Mycobacterium tuberculosis est un groupe de 
mycobacteries qui comprend M. bovis-BCG, M. bovis, M. 
tuberculosis, M. africanum et M, microti. 

Un procede de detection de faibles quantites de 
mycobacteries, appartenant au complexe tuberculosis, par 

20 amplification genique et hybridation directement sur des 
echantillons biologiques a ete mis au point. Ledit procede 
utilise la sequence d' insertion IS6110 (Brevet europeen EP 0 
490 951 Bl)-. Thierry et al . ont decrit en 1990 une sequence 
specifique du complexe Mycobacterium tuberculosis et nominee IS 

25 6110. Certains auteurs ont propose d 'amplifier specif iquement 
l'ADN provenant de Mycobacterium en utilisant des amorces 
nucleiques dans une methode d* amplification, telle que la 
reaction de polymerase en chaine (PCR). Patel et al. ont decrit 
en 1990 1 1 utilisation de plusieurs amorces nucleiques choisies 

30 a partir d'une sequence connue en tant que sonde dans 
1 'identification de M. tuberculosis. Cependant, la longueur des 
fragments obtenue en utilisant ces amorces etait differente de 
la longueur theorique attendue et plusieurs fragments de taille 
variable etaient obtenus. De plus, les auteurs ont observe 

35 1' absence d ■ hybridation des produits amplifies avec le plasmide 
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ayant servi a determiner les amorces. Ces resultats indiquent 
que ces amorces ne seraient pas appropriees dans la detection 
de la presence de M. tuberculosis dans un echantillon 
biologique et confirment la nature critique du choix des 
amorces. La meme annee, J.L. Guesdon et D. Thierry ont decrit 
une methode de detection de M. tuberculosis, de grande 
sensibilite, par amplification d'un fragment d'ADN de M. 
tuberculosis localise au sein de la sequence IS6110 (Brevet 
europeen EP 461 045) a l'aide d' amorces gene rant des fragments 
d'ADN amplifie de longueur constante, meme lorsque le choix des 
amorces conduisait a 1 Amplification de fragments longs (de 
I'ordre de 1000 £ 1500 bases) ou le risque d • interruption de la 
polymerisation est elevee en raison des effets de la structure 
secondaire de la sequence. D'autres amorces specif iques de la 
sequence IS6110 sont decrites dans le brevet europeen N° EP- 
0490 951. 

Les inventeurs ont montre (resultats non publies) que 
certains isolats cliniques de Mycobacterium tuberculosis 
etaient exempts de la sequence d' insertion IS6110 et ne 
pouvaient done etre detectes a l'aide des oligonucleotides 
specifiques de cette sequence pouvant conduire ainsi a des 
resultats de diagnostic faussement negatifs. Ces resultats 
confirment une observation similaire faite par Yuen et al . en 
1993. L' impossibility de detecter ces souches pathogenes 
potentiellement presentes dans un echantillon biologique 
preleve sur un patient est ainsi susceptible de conduire a des 
difficultes voire des erreurs de diagnostic. 

M. bovis et M. tuberculosis, les agents causals de la 
tuberculose, sont des bacteries facultatives intracellulars . 
Ces agents ont developpe des mecanismes pour assurer leur 
survie et leur replication a 1 ' interieur du macrophage, un des 
types cellulaires qui est suppose eradiquer 1' invasion par des 
microorganismes. Ces agents sont capables de moduler 
1' evolution normale de leur phagosome et de les empecher de se 
differencier en un compartiment acide riche en hydrolase (5, 6, 
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23, 26) . Cependant, cette modulation n'est possible que si la 
bacterie est vivante au sein du phagosome, suggerant que des 
composes synthetises de maniere active et/ou secretes a 
l'interieur de la cellule font partie de ce mecanisme. Des 
proteines exportees sont probablement impliquees dans ce 
mecanisme. En depit des problemes majeurs de sante lies a ces 
organismes pathogenes, on sait peu de choses sur leurs 
proteines exportees et/ou secretees. Des analyses en SDS-PAGE 
de filtrat de culture de M. tuberculosis montrent au moins 30 
proteines secretees (1,19,38). Certaines d'entre elles ont ete 
caracterisees, leurs genes clones et sequences (7,35,37). 
D'autres, bien qu'il s'agisse d'antigenes immunodominants 
d ! importance majeure pour induire une immunite protectrice 
(2,21), ne sont pas totalement identifies. En outre, il est 
probable que de nombreuses proteines exportees restent fixees 
sur la membrane cellulaire et par consequent ne soient pas 
presentes dans les surnageants de culture. II a ete montre que 
les proteines localisees a la surface externe de diverses 
bacteries pathogenes, telles que l'invasine de 103 kDa de 
Yersina Pseudotuberculosis (14) ou 1 ' internaline de 80 kDa de 
Listeria monocytogenes (10) jouent un role important dans les 
interactions avec les cellules hotes et par consequent, dans la 
pathogenicity comme dans 1' induction de reponses protectrices . 
Ainsi, une proteine liee a la membrane pourrait etre importante 
pour 1' infection a M. tuberculosis comme pour 1" induction de 
reponse protectrice contre cette infection . Ces proteines 
pourraient revetir un interet certain pour la preparation de 
vaccins . 

Recemment, il a ete decrit 1' adaptation aux 
mycobacteries d'une methodologie genet ique pour 

1 ' identification et la selection phenotypique de proteines 
exportees (15) . Cette methode utilise la phosphatase alkaline 
(PhoA) periplasmique d'E. coli. Un vecteur plasmidique a ete 
construit permettant la fusion de genes entre un gene PhoA 

tronquee et des genes codant pour des proteines exportees (3, 
11) . 
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Par cette methode, il a pu etre identifier un gene de 
M. tuberculosis (erp (2)) presentant des homologies avec une 
proteine exportee de 28 kDa de M. leprae, qui est une cible 
frequente des reponses humorales de la forme lepromateuse de la 
5 lepre, et avec une proteine presentant des motifs aminoacides 
caracteristiques de la desaturase de plante (des) . 

Cependant, cette methode genet ique d 1 identification de 
proteines exportees ne permet pas d'evaluer facilement 
1 'expression intracellulaire des genes correspondants . Une 

10 telle evaluation est d'une importance primordiale a la fois 
pour la selection de bons candidats vaccins et pour la 
comprehension des interactions entre les bacteries et leurs 
cellules hotes. L 1 induction de I 1 expression de facteur de 
virulence par contact de cellule cible pathogene a ete decrite. 

15 C'est le cas par exemple pour le facteur de virulence Yops (18) 
de Yersina pseudotuberculosis . Shigella par contact avec les 
cellules cibles relargue les proteines Ipa dans le milieu de 
culture, et Salmonella synthetise de nouvelles structures de 
surface . 

- () Compte tenu de ce qui precede, il existe aujourd'hui un 

grand besoin de developper de nouveaux vaccins contre les 
mycobacteries pathogene ainsi que de nouveaux tests de 
diagnostic specif iques, fiables et rapides. Ces developpements 
necessitent la mise au point d'outils specif iques encore plus 

25 performants permet tant, d'une part, d'isoler ou d'obtenir des 
sequences de nouveaux polypeptides specif iques, notamment 
immunogenes, et, d" autre part, de mieux comprendre le mecanisme 
des interactions entre les bacteries et leurs cellules hotes 
comme notamment l 1 induction de 1' expression de facteur de 

30 virulence . Ceci est precisement l'objet de la presente 
invention . 

Les inventeurs ont defini et realise dans ce but de 
nouveaux vecteurs permet tant le criblage, le clonage et/ou 
35 1 'expression de sequences d'ADN de mycobacteries afin 
d 1 identifier parmi ces sequences, des acides nucleiques codant 
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pour des proteines d'interet, de preference des proteines 
exportees, pouvant etre localisees sur la membrane bacterienne 
et/ou secretes, et d' identifier parmi ces sequences celles qui 
sont induites ou reprimees lors de l 1 infection. 

L 1 invention vise aussi de nouveaux polypeptides et de 
nouveaux polynucleotides de mycobacteries ayant pu etre isoles 
au moyen des vecteurs precedents et susceptibles d'entrer dans 
la realisation de compositions pour la detection d'une 
infection par des mycobacteries, ou pour la protection contre 
une infection due a des mycobateries . 

L ' invention a done pour objet un vecteur recombinant de 
criblage, de clonage et/ou d' expression, caracterise en ce 
qu'il se replique chez des mycobacteries et en ce qu'il 
contient : 

1) un replicon fonctionnel chez les mycobacteries ; 

2) un marqueur de selection ; 

3) une cassette reporteur comprenant : 

a) un site de clonage multiple (polyl inker) , 

b) eventuellement un terminateur de transcription actif 
chez les mycobacteries, en amont du polylinker, 

c) une sequence nucleotidique codante issue d'un gene 
codant pour un marqueur d ' expression , d < exportation et/ou de 
secretion de proteine, ladite sequence nucleotidique etant 
depourvue.de son codon d' initiation et de ses sequences de 
regulation, et 

d) une sequence nucleotidique codante issue d'un gene 
codant pour un marqueur d'activite de promoteurs contenus dans 
le meme fragment, ladite sequence nucleotidique etant pourvue 
de son codon d ' initiation . 



Le marqueur d' exportation et/ou de secretion est une 
sequence de nucleotides dont 1' expression suivie de 
1' exportation et/ou de la secretion depend des elements de 
regulation qui controlent son expression. 

Par ^sequences ou elements de regulation de 1' expression 
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de la production de polypeptides et de sa localisation ' ■ , on 
entend une sequence promotrice de la transcription, une 
sequence comprenant le site de liaison au ribosome (RBS) , les 
sequences responsables de 1 ' exportation et/ou la secretion 
5 telles que la sequence dite sequence signale. 

Un premier marqueur interessant d ' exportation et/ou 
d' expression est une sequence codante issue du gene phoA. Le 

cas echeant, elle est tronquee de telle fa<?on que l'activite 
phosphatase alcaline est cependant susceptible d'etre restauree 

10 lorsque la sequence codante tronquee est placee sous le 
controle d'un promoteur et d 1 elements de regulation appropries. 

D'autres marqueurs d 1 exposition, d' exportation et/ou de 
secretion peuvent etre utilises. On citera a titre d'exemples 
une sequence du gene p-agarase, de la nuclease d'un 

15 staphylocoque ou d'une (5-lactamase. 

Parmi les marqueurs interessants d'activite de promoteurs 
contenus dans le meme fragment, on prefere une sequence codante 
issue du gene luc de luciferase de luciole pourvue de son codon 
d ' initiation . 

20 D'autres marqueurs d'activite de promoteurs contenus dans 

le meme fragment peuvent etre utilises. On citera a titre 
d'exemples une sequence du gene de la GFP (Green Fluorescent 
Protein) . 

Le terminateur de transcription doit etre fonctionnel chez 
25 les mycobacteries . Un terminateur avantageux est a cet egard le 
terminateur du coliphage T4 (tT4) . D'autres terminateurs 
appropries pour la realisation de 1' invention peuvent etre 
isoles en utilisant la technique presentee dans les exemples, 
par exemple au moyen du vecteur cassette H. 
30 Un vecteur particulierement prefere pour la realisation de 

1" invention est un plasmide choisi .parmi les plasmides suivants 
deposes a la CNCM (Collection Nationale de Cultures de 
Microorganismes , Paris, France) : 

a) pJEVDa depose a la CNCM sous le N° I - 1797 # le 12/12 

35 1996, 

b) pJEVDb depose a la CNCM sous le N° 1-1906, le 25 
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juillet 1997, 

c) pJEVDc depose a la CNCM sous le N° I-1799 , le 12/12 

1996, 

d) pJEVD/M. tuberculosis depose a la CNCM sous le N° I- 
5 1907, le 25 juillet 1997. 

Pour la selection, ou 1 • identification de sequences 
d'acides nucleiques de mycobacteries codant pour des 
polypeptides susceptibles d'Stre incorpores dans des 
compositions immunogenes, ou antigeniques pour la detection 
d'une infection, ou susceptibles d'induire ou de reprimer un 
facteur de virulence de mycobacteries, l e vecteur de 
1- invention comprendra, en l'un des sites de clonage multiple 
du polylinker, une sequence de nucleotides d'une mycobacterie 
chez laquelle on detecte la presence de sequences correspondant 
a des polypeptides exportes et/ou secretes pouvant etre 
induits ou reprimes lors de 1' infection, ou encore exprimes ou 
produits de facon constitutive, leurs sequences promotrices 
et/ou regulatrices associees susceptibles de permettre ou de 
favoriser 1 ' exportation et/ou la secretion desdits polypeptides 
d'interet, ou tout ou partie de genes d'interet codant pour 
lesdits polypeptides. 

De preference, cette sequence est obtenue par 
fragmentation physique ou par digestion enzymatique de 1'ADN 
genomique ou de 1 'ADN complementaire d'un ARN d'une 
mycobacterie et de preference d'une mycobacterie pathogene. 

Selon un premier mode de realisation de l'inventionr la 
digestion enzymatique de 1 ' ADN genomique ou de 1 'ADN 
complementaire est effectuee a partir de M. tuberculosis. 

De preference cet ADN est digere avec une enzyme telle 
que sau3A, BclI,BglII. 

D'autres enzymes de digestion telies que Seal, Apal, 
SacII, KDnl ou encore des nucleases ou des polymerases, peuvent 
naturellement etre mises en oeuvre, des lors qu'elles 
permettent 1 • obtention de fragments dont les extremites peuvent 
etre inserees dans l'un des sites de clonage du polylinker du 
vecteur de 1' invention. 
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Le cas echeant, des digestions avec differentes enzymes 
seront effectuees simultanement . 



Des vecteurs recombinants preferes pour la realisation de 
5 1' invention sont choisis parmi les vecteurs recombinants 
suivants deposes a la CNCM : 



a) p6D7 depose le 28 janvier 1997 a la CNCM sous le N°I-1814, 

b) p5A3 depose le 28 janvier 1997 a la CNCM sous le N°I-1815 / 
10 c) p5F6 depose le 28 janvier 1997 a la CNCM sous le N°I-1816, 

d) p2A29 depose le 28 janvier 1997 a la CNCM sous le N°I-1817, 

e) pDP428 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1818, 

f) p5B5 depose le 28 janvier 1997 a la CNCM sous le N°I-1819, 
15 g) plC7 depose le 28 janvier 1997 a la CNCM sous le N°I-1820 / 

h) p2D7 depose le 28 janvier 1997 a la CNCM sous le N°I-1821, 

i) plB7 depose le 31 janvier 1997 a la CNCM sous le N°I-1843. 



Parmi les plus preferes, on prefere le vecteur recombinant 
20 pDP428 depose le 28 janvier 1997 a la CNCM sous le N°I-1818, 

Les vecteurs de 1 1 invention peuvent egalement etre utilises 
pour determiner la presence de sequences d'interet, de 
preference correspondant a des proteines exportees et/ou 
secretees, et/ou capables d'etre induites ou reprimees lors de 
25 1' infection, notamment lors de la phagocytose par les 
macrophages, pJEVD et selon ce qui a ete expose precedemment , 
chez des mycobacteries telles que M. africanum, M. bovis, M. 

avium ou M. leprae dont on aura traite l'ADN ou l'ADNc avec des 

enzymes determinees. 

30 L 1 invention a egalement pour objet un procede de criblage 

de sequences de nucleotides issues de mycobacteries pour 
determiner la presence de sequences correspondant a des 
polypeptides exportes et/ou secretes pouvant etre induits ou 
reprimes lors de l 1 infection, leurs sequences promotrices et/ou 

35 regulatrices associees susceptibles notamment de permettre ou 
de favoriser 1 1 exportation et/ou la secretion desdits 
polypeptides d'interet, ou tout ou partie de genes d'interet 
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codant pour lesdits polypeptides, caracterise en ce qu'il met 
en oeuvre un vecteur recombinant selon I 1 invention. 

L' invention concerne aussi un procede de criblage, selon 
1' invention, caracterise en ce qu'il comprend les etapes 
5 suivantes : 

a) la digestion des sequences d'ADN de mycobacteries par 
au moins une enzyme determinee et la recuperation des fragnents 
de digestion obtenus ; 

b) 1 ' insertion des fragments de digestion dans un site de 
10 clonage compatible avec l 1 enzyme de l f etape a) du polylinker 

d'un vecteur selon 1' invention ; 

c) si besoin, 1 ' amplification du fragment de digestion 
contenu dans le vecteur, par exemple par replication de ce 
dernier apres insertion du vecteur ainsi modifie dans une 

15 cellule determinee, par exemple E coli ; 

d) la transformation des cellules notes par le vecteur 
amplifie a l'etape c) , ou en 1 1 absence d 1 amplification, par le 
vecteur de l'etape b) ; 

e) la culture des cellules notes transformers dans un 
20 milieu permettant la mise en evidence du marqueur d 1 exportation 

et/ou de secretion, et /ou du marqueur d'activite de promoteurs 
contenu dans le vecteur ; 

f) la detection des cellules notes positiveiS. . 0 . s 
(colonies positives) pour I 1 expression du marqueur 

25 d ' exportation et/ou de secretion, et /ou du marqueur d'activite 
de promoteurs ; 

g) l'isolement de l'ADN des colonies positives et 
1* insertion de cet ADN dans une cellule identique a celle de 
l'etape c) ; 

30 h) la selection des insertions contenues dans le vecteur, 

permettant l'obtention de clones positifs pour le marqueur 
d 1 exportation et/ou de secretion, et /ou pour le marqueur 
d'activite de promoteurs ; 

i) l'isolement et la caracterisation des fragments d 1 ADN 
35 de mycobacteries contenues dans ces inserats. 

La mise en oeuvre de ce procede permet la construction de 
banques d'ADN cornportant des sequences correspondant a des 
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polypeptides susceptibles d'etre exportes et/ou secretes, et/ou 
susceptibles d'etre induits ou reprimes lors de 1 1 infection 
lorsqu'ils sont produits au sein de mycobacteries 
recombinant es. L'etape i) du procede peut comprendre une etape 
5 de sequengage des insertions selectionnees. 

De preference, dans le procede selon 1' invention, le 
vecteur utilise est choisi parmi les plasmides pJEVDa (CNCM, 
N° 1-1797) ,pJEVDb (CNCM, N° 1-1906), pJEVDc (CNCM, N° 1-1799) 
ou pJEVD/Af. tuberculosis (CNCM, N°I-1907, 1907), et la 

10 digestion des sequences d'ADN de mycobacteries est effectuee au 
moyen de 1* enzyme sau3A. 

Selon un mode de realisation prefere de 1' invention, le 
procede de criblage est caracterise en ce que les sequences de 
mycobacteries sont issues d'une mycobacterie pathogene, par 

15 exemple de M. tuberculosis, M. bovis, M. avium, M. africanum ou 

M. leprae. 

L 1 invention comprend egalement une banque d'ADN 
genomique ou d'ADNc complementaire d'ARNm de mycobacterie, 
caracterisee en ce qu'elle est obtenue par un procede 
20 comprenant les etapes a) , b) et c) du procede precedent selon 
1' invention, de preference une banque d'ADN genomique ou d'ADNc 
complementaire d'ARNm de mycobacteries pathogenes, de 
preference de mycobacteries appartenant au groupe du complexe 
Mycobacterium tuberculosis, de preference de Mycobacterium 

25 tuberculosis . 

L 1 invention a egalement pour objet les sequences 
nucleotidiques de mycobacteries selectionnees apres la 
realisation du procede selon 1' invention ci-dessus decrit. 

Selon un mode de realisation particulier de 1' invention, 

30 des sequences preferees sont par exemple les fragments d 1 ADN de 
mycobacteries de sequence SEQ ID N°3, SEQ ID N°4 f SEQ ID N°5, 
SEQ ID N°6, SEQ ID N°7, SEQ ID N°8, SEQ ID N°9 ou SEQ ID N°10, 
contenus respect ivement dans les vecteurs p6D7 (CNCM, N°I- 
1814), p5A3 (CNCM, N° I - 1815) , p5F6 (CNCM, N°I-1816) , p2A29 

35 (CNCM, N°I-1817), p5B5 (CNCM, N° 1-1819) , plC7 (CNCM, N°I-1820) , 
p2D7 (CNCM,N°I-1821) et plB7 (CNCM, N°I-1843). 
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On prefere egalement les sequences nucleiques SEQ ID N° 11 
et SEQ ID N°24 . 

Lorsque la sequence codante issue du gene marqueur 
5 d ' exportation et/ou de secretion est une sequence issue du gene 
phoA, 1 'exportation et/ou la secretion du produit du gene phoA, 

le cas echeant tronque, n'est obtenue que lorsque cette 
sequence est inseree en phase avec la sequence ou element de 
regulation de l 1 expression de la production de polynucleotides 

10 et sa localisation placee en amont, qui contient les elements 
controlant l f expression, 1 1 exportation et/ou la secretion issus 
de sequence de mycobacteries. 

Les vecteurs recombinants de 1' invention peuvent bien 
entendu comprendre des sites de clonage multiples decales de un 

15 ou deux nucleotides par rapport a un vecteur selon 
1' invention, permettant ainsi d'exprimer le polypeptide 

correspondant au fragment d'ADN de mycobacterie insere et 
susceptible d'etre traduit selon l'un des trois cadres de 
lecture possibles. 

20 Par exemple les vecteurs preferes pJVEDb et pJVEDc de 

1' invention se distinguent du vecteur prefere pJVEDa par un 
decalage respectif de un et de deux nucleotides au niveau du 
site de clonage multiple. 

Ainsi, les vecteurs de 1' invention sont capables 

25 d'exprimer chacun des polypeptides susceptibles d'etre codes 
par fragment d'ADN de mycobacterie insere. Cesdits 
polypeptides, caracterises en ce qu'ils sont susceptibles 
d'etre codes par ledit fragment d'ADN et en ce qu'ils sont 
susceptibles d'etre exportes et/ou secretes, et/ou induits ou 

30 reprimes lors de 1' infection, font partie de 1' invention. 

L' invention a aussi pour objet des mycobacteries 
recombinantes contenant un vecteur recombinant selon 
1 ' invention decrit precedemment . Une mycobacterie preferee est 
une mycobacterie du type M. smeqmatis. 

35 M. sweqmatis permet avantageusement de tester l'efficacite 

de sequences de mycobacteries, pour le controle de 
1 ' expression, de 1 1 exportation et/ou de la secretion, et/ou de 
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l'activite de promoteurs d ! une sequence donnee, par exemple 
d'une sequence codant pour un marqueur tel que la phosphatase 
alcaline et/ou la lucif erase. 

Une autre mycobacterie preferee est une mycobacterie du 
5 type M. bovis, par exemple la souche BCG utilisee actuellement 
pour la vaccination contre la tuberculose. 

Une autre mycobacterie preferee est une souche de M. 

tuberculosis, M.bovis ou M.africanum possedant potentiellement 

tous les systemes de regulation appropries. 
10 Les inventeurs ont ainsi caracterise un polynucleotide 

constitue par une sequence de nucleotides presente chez toutes 
les souches testees de mycobacteries appartenant au complexe de 
Mycobacterium tuberculosis . Ce polypeptide, denomme DP428 

contient un cadre ouvert de lecture (ORF) codant pour un 
15 polypeptide d'environ 12 kD. Ce poids moleculaire (PM) 
correspond au PM theorique de la proteine mature obtenue apres 
clivage de la sequence signale, le PM de la proteine ou 
polypeptide DP428 etant d'environ 10 kD apres ancrage potent iel 
au peptidoglycane et coupure potentielle entre S et G du motif 
20 LPISG. 

Ce polynucleotide inclut, d'une part, un cadre ouvert de 
lecture correspondant a un gene de structure et, d' autre part, 
les signaux de regulation de I 1 expression de la sequence 
codante en amont et en aval de cette derniere . Le polypeptide 

25 DP428 est compose d'un peptide signal, d'une region centrale 
hydrophile et d'une region C-terminale hydrophobe. Cette 
derniere se termine par deux residus arginines (R) , signal de 
retention, et est precede par un motif LPISG qui rappelle le 
motif LPXTG d 1 ancrage au peptidoglycane (Schneewind et al) . 

30 Par gene de structure aux fins de la presente invention, 

on entend un polynucleotide codant pour une proteine, un 
polypeptide ou encore un fragment de ces derniers, ledit 
polynucleotide ne comprenant que la sequence correspondant au 
cadre ouvert de lecture (ORF) , ce qui exclut les sequences du 

35 cote 5* du cadre ouvert de lecture (ORF) qui dirigent 
1' initiation de la transcription. 
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Ainsi, 1' invention concerne un polynucleotide de sequence 
SEQ ID N°l. 

Plus particulierement , 1' invention concerne un 
polynucleotide caracterise en ce qu'il comprend un 
5 polynucleotide choisi parmi : 

a) un polynucleotide de sequence SEQ ID N°l ou SEQ ID N°2, 

b) un polynucleotide dont la sequence est complementaire de la 
sequence du polynucleotide def ini en a) , 

c) un polynucleotide dont la sequence comport e au moins 80% 
10 d' identity avec un polynucleotide def ini en a) ou b) , 

d) un polynucleotide hybridan t dans des conditions de forte 
stringence avec une sequence de polynucleotide def ini en a) , b) 
ou c) , 

e) un fragment de polynucleotide def ini en a) , b) , c) ou d) , 
15 et comportant au moins 8 nucleotides. 

On entend par sequence nucleotidique, polynucleotide ou 
acide nucleique, selon la presente invention, aussi bien un ADN 
double brin, un ADN simple brin que des produits de 
transcription desdits ADN, 

20 Par polynucleotide de sequence complementaire, on entend 

tout ADN dont les nucleotides sont complementaires de ceux de 
la SEQ ID N°l ou d ' une partie de la SEQ ID N°l, et dont 
1 1 orientation est inversee . 

Par pourcentage d'homologie au sens de la presente 

25 invention, on entend un pourcentage d'identite entre les bases 
des deux polynucleotides homologues, ce pourcentage etant 
purement statistique et les differences entre les deux 
polynucleotides etant reparties au hasard et sur toute leur 
longueur . 

30 Une hybridation dans des conditions de forte stringence 

signifie que les conditions de temperature et de force ionique 
sont choisies de telle maniere qu'elles permettent le maintien 
de 1 ' hybridation entre deux fragments d 1 ADN complementaires. 

A titre illustratif , des conditions de forte stringence de 

35 l'etape d 1 hybridation aux fins de definir les fragments 
polynucleotidiques decrits ci-dessus, sont avantageusement les 
suivantes : 
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1 'hybridation est realisee a une temperature 
preferentielle de 65°C, en presence de tampon commercialise 
sous le nom de rapid-hyb buffer par Amersham (RPN 163 6) et 100 
/ig/ml d'ADN de E.coli. 

Les etapes de lavage peuvent, par exemple, etre les 
suivantes : 

- deux lavages de 10 min, pref erentiellement a 65°C, dans un 
tampon 2 x SSC et 0,1% SDS; 

- deux lavages de 10 min # pref erentiellement a 65°C, dans un 
tampon 2 x SSC et 0,1% SDS ; 

- un lavage de 10 min, pref erentiellement a 65°C, dans un 
tampon de 0,1 x SSC et 0 # 1% SDS. 

1 x SSC correspond a 0,15 M NaCl et 0,05M citrate de Na et 
une solution de 1 x Denhardt correspond a 0,02% Ficoll, 0,02% 
de polyvinylpyrrolidone et 0,02% de serum albumine bovine. 

Avantageusement, un fragment nucleotidique repondant a la 
definition precedente aura au moins 8 nucleotides, de 
preference au moins 12 nucleotides, et encore plus 
preferentiellement au moins 20 nucleotides consecutifs de 
lasequence dont il est issu. 

Pour les conditions de mise en oeuvre des enzymes de 
restriction dans le but d'obtenir des fragments nucleotidiques 
des polynucleotides selon 1' invention, on se referera 
avantageusement a 1'ouvrage de Sambrook de 1989. 

Avantageusement , un polynucleotide de 1* invention 

contiendra au moins une sequence comprenant 1 ■ enchainement de 
nucleotides allant du nucleotide en position nt 964 au 
nucleotide nt 1234 du polynucleotide de sequence SEQ ID N°l. 

La presente invention a egalement pour objet un 
polypeptide issu d'une mycobacterie, caracterise en ce qu'il 
est present uniquement chez les mycobacteries appartenant au 
complexe de Mycobacterium tuberculosis. 

La presente invention a aussi pour objet un polypeptide de 
sequence d'acides amines SEQ ID N°l ou SEQ ID N°2. 

L * invention concerne egalement un polypeptide caracterise 
en ce qu'il comprend un polypeptide choisi parmi : 
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a) un polypeptide de sequence d* acides amines SEQ ID N°l ou SEQ 
ID N°2, 

b) un polypeptide homologue au polypeptide def ini en a) , 

c) un fragment d*au moins 5 acides amines d'un polypeptide 
5 def ini en a)ou b) , 

d) un fragment biologiquement actif d'un polypeptide def ini en 
a) , b) , ou c) . 

Par polypeptide homologue, on entendra designer les 
polypeptides presentant, par rapport au polypeptide naturel 
10 DP428, certaines modifications comme en particulier une 
deletion, addition ou substitution d'au moins un acide amine, 
une troncation, un allongement , une fusion chimerique, et/ou 
une mutation. Parmi les polypeptides homologues, on prefere 
ceux dont la sequence d* acides amines presente au moins 80%, de 

15 preference 90%, d'homologie avec les sequences d'acides amines 
des polypeptides selon 1' invention. Dans le cas d'une 
substitution, un ou plusieurs acides amines consecutifs ou non 
consecutifs, sont remplaces par des acides amines 
« equivalents ». L 1 expression acide amine « equivalent » vise 

20 ici a designer tout acide amine susceptible d'etre substitue a 
I'un des acides amines de la structure de base sans cependant 
modifier essentiellement les proprietes immunogenes des 
peptides correspondants . En d'autres termes, les acides amines 
equivalents seront ceux qui permettent l'obtention d'un 

25 polypeptide de sequence modifiee qui permet 1* induction in vivo 
d'anticorps capables de reconnaitre le polypeptide de sequence 
SEQ ID N°2 ou l'un de ses fragments ci-dessus definis. 

Ces aminoacyles equivalents peuvent etre determines soit 
en s'appuyant sur leur homologie de structure avec les 

30 aminoacyles auxquels ils se substituent, soit sur les resultats 
des essais d* immunogenicite croisee auxquels les differents 
peptides sont susceptibles de donner lieu. 

A titre d'exemple, on mentionnera les possibilites de 
substitutions susceptible d'etre effectuees sans qu'il en 

35 resulte une modification approfondie de 1 ' immunogenicite des 
peptides modifies correspondants, les remplacements, par 
exemple, de la leucine par la valine ou 1 1 isoleucine, de 
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l'acide aspartique par l'acide glutamique, de la glutamine par 
1 1 asparagine , de l'arginine par la lysine etc., les 
substitutions inverses etant naturellement envisageables dans 
les memes conditions. 
5 Par fragment biologiquement act if, on entendra designer en 

particulier un fragment de sequence d' acides amines de 
polypeptide presentant au moins une des caracterist iques des 
polypeptides selon 1' invention, notamment en ce qu'il est : 

capable d'etre exporte et/ou secrete par une mycobacterie, 
10 et/ou d'etre induit ou reprime lors de 1' infection par la 
mycobacterie ; et/ou 

- capable d'induire, de reprimer ou de moduler, directement ou 
indirectement , un facteur de virulence de mycobacterie ; et/ou 
capable d'induire une reaction d ' immunogenicite dirigee 
15 contre les mycobacteries ; et/ou 

capable d'etre reconnu par un anticorps specif ique de 
mycobacterie . 

Par fragment de polypeptide, on entend designer un 
polypeptide comportant au minimun 5 acides amines, de 
20 preference 10 acides amines et 15 acides amines. 

Un polypeptide de l 1 invention, ou un de ses fragments , 
tels que definis precedemment , est susceptible d'etre reconnu 
specif iquement par les anticorps presents dans le serum de 
patients infectes par des mycobacteries appartenant au complexe 
25 de Mycobcaterium tuberculosis . 

Font ainsi partie de 1' invention les fragments du 
polypeptide DP428 de sequence ID N°l ou ID N°2, qui peuvent 
etre obtenus par clivage dudit polypeptide par une enzyme 
proteolytique, telle que la trypsine ou la chymotrypsine ou la 

30 collagenase, ou par un reactif chimique, tel que le bromure de 
cyanogene (CnBr) ou encore en placant le polypeptide DP428 dans 
un environnement tres acide, par exemple a pH 2,5. 

Des fragments peptidiques preferes selon 1' invention, pour 
une utilisation en diagnostic ou en vaccination, sont les 

35 fragments contenus dans des regions du polypeptide DP428 
susceptibles d'etre naturellement: exposees au solvant et de 
presenter ainsi des proprigtes d 1 immunogenicite importante. De 
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tels fragments peptidiques peuvent etre prepares indif f eremment 
par synthese chimique, a partir d'hotes transformes par un 
vecteur d' expression selon 1' invention contenant un acide 
nucleique permettant l'expression desdits fragments, place sous 
5 le controle des elements de regulation et/ou d' expression 
appropries ou encore par clivage chimique ou enzymat ique . 

Une analyse de 1 ' hydrophilicite du polypeptide DP428 a ete 
realisee a 1 1 aide du logiciel DNA Strider™ (commercialise par 
le CEA Saclay) , sur la base d'un calcul du caractere 

10 hydrophile de la region codante pour le DP428 de la SEQ ID N°2. 
Les resultats de cette analyse sont presentes a la figure 4, ou 
sont detailles, pour chacun des acides amines (AA) de position 
55,72,99 et 107, definie dans la SEQ ID N°2 , 1 1 indice 
d* hydrophilicite. Plus 1 ' indice d' hydrophilicite est eleve, 

15 plus 1' acide amine considere est susceptible d'etre expose au 
solvant dans la molecule native, et est en consequence 
susceptible de presenter un degre d' antigenicity eleve. Ainsi, 
un enchainement d'au moins sept acides amines possedant un 
indice eleve d 1 hydrophilicite (>0,3) peut const ituer la base de 

20 la structure d'un peptide candidat immunogene selon la presente 
invention . 

L 1 invention concerne egalement les sequences d' acide 
nucleique utilisable comme sonde ou amorce, caracterisees en ce 
que lesdites sequences sont choisies parmi les sequences 

25 d' acide nucleique de polynucleotides selon 1' invention. 

L 1 invention concerne en outre 1 ' utilisation d'une sequence 
d* acide nucleique de polynucleotides selon 1' invention comme 
sonde ou amorce, pour la detection et/ou 1 ' amplification de 
sequence d 1 acide nucleique. 

30 Les polynucleotides selon 1 ' invention peuvent ainsi etre 

utilises pour selectionner des amorces nucleotidiques, 
notamment pour la technique PCR. 

Cette technique necessite le choix de paires 
d 'oligonucleotides encadrant le fragment qui doit etre 

55 amplifie. On peut, par exemple, se referer a la technique 
decrite dans le brevet americain U.S. N° 4 683 202. Ces amorces 
oligodesoxyribonucleotidiques ou oligoribonucleotidiques ont 
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avantageusement une longueur d'au moins 8 nucleotides, de 
preference d'au moins 12 nucleotides, et encore plus 
preferentiellement au moins 20 nucleotides. On preferera en 
particulier des amorces d'une longueur comprise entre 8 et 30 
5 et de preference 12 et 22 nucleotides. L'une des deux amorces 
est complementaires du brin ( + ) [amorce allerj de la mat rice et 
1' autre amorce est complementaire du brin (-) [amorce retour] . 
II est important que les amorces ne possedent pas de structure 
secondaire ou de sequence complementaire l'une de 1' autre. 

10 D 1 autre part, la longueur et la sequence de chaque amorce 
doivent etre choisies de maniere a ce que les amorces ne 
s'hybrident pas avec d'autres acides nucleiques provenant de 
cellules procaryotes ou eucaryotes, en particulier avec les 
acides nucleiques provenant de mycobacteries n ' appartenant pas 

15 au complexe Mycobacterium tuberculosis, ni avec l'ADN ou 1'ARN 
humain pouvant eventuellement contaminer 1 ' echantillon 
biologique . 

Les fragments amplifies peuvent etre identifies apres une 
elect rophorese en gel d 1 agarose ou de polyacrylamide , ou apres 

20 une electrophorese capillaire, ou encore apres une technique 
chromatographique (filtration sur gel, chromatographie 
hydrophobe ou chromatographie echangeuse d'ions) . La 
specif icite de 1 1 amplification peut etre controlee par 
hybridation moleculaire en utilisant comme sondes les sequences 

25 nucleotidiques de polynucleotides de 1' invention, des plasmides 
contenant ces sequences ou leurs produits d 1 amplification. 

Les fragments nucleotidiques amplifies peuvent etre 
utilises comme reactifs dans des reactions d ' hybridation afin 
de mettre en evidence la presence, dans un echantillon 

30 biologique, d'un acide nucleique cible de sequence 
complementaire a celle desdits fragments nucleotidiques 
amplifies. 

Parmi les polynucleotides selon 1* invention, utilisables 
comme amorces nucleotidiques, on prefere : SEQ ID N°25 et SEQ 
35 ID N°26 . 



22 



2767336 



Parmi les polynucleotides selon 1' invention, utilisables 
comme sondes nucleotidiques, on prefere le fragment 
polynucleotidique comprenant les nucleotides 964 a 1234 de SEQ 
ID N°l. 

5 Ces sondes et amplicons peuvent etre marques ou non par 

des elements radioactifs ou par des molecules non radioactives, 
telles que des enzymes ou des elements f luorescents . . 

L 1 invention vise egalement les fragments nucleotidiques 
susceptibles d'etre obtenus par amplification a 1 1 aide 
10 d'amorces selon 1' invention. 

D'autres techniques d' amplification de 1' acide nucleique 
cible peuvent etre avantageusement employees comme alternatives 
a la PCR. 

La technique SDA (Strand Displacement Amplification) ou 
15 technique d 1 amplification a deplacement de brin (Walker et al . , 
1992) est une technique d 1 amplification isotherme dont le 
principe est fonde sur la capacite d'une enzyme de restriction 
de couper l'un des deux brins de son site de reconnaissance qui 
se trouve sous une forme hemiphosphorothioate et sur la 
20 propriete d'une ADN polymerase d'initier la synthese d'un 
nouveau brin d'ADN a partir de l'extremite 3 ' OH creee par 
1' enzyme de restriction et de deplacer le brin prealablement 
synthetise qui se trouve en aval. 

Les polynucleotides de 1' invention, en particulier les 
25 amorces selon 1' invention, peuvent egalement etre mis en oeuvre 
dans d'autres procedes d* amplification d'un acide nucleique 
cible, tels que : 

- la technique TAS (Transcription-based Amplification System) , 
decrite par Kwoh et al . en 1989; 

30 - la technique 3SR (Self -Sustained Sequence Replication) , 
decrite par Guatelli et al. en 1990; 

la technique NASBA (Nucleic Acid Sequence Based 
Amplification) , decrite par Kievitis et al . en 1991; 

- la technique TMA (Transcription Mediated Amplification) . 

35 Les polynucleotides de 1' invention peuvent aussi etre 

employes dans des techniques d 'amplification ou de 
modification de 1' acide nucleique servant de sonde, telles que: 
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la technique LCR (Ligase Chain Reaction) , decrite par 
Landegren et al . en 1988 et perf ectionnee par Barany et al . en 
1991, qui emploie une ligase thermostable; 

- la technique de RCR (Repair Chain Reaction) , decrite par 
5 Segev en 1992; 

- la technique CPR (Cycling Probe Reaction) , decrite par Duck 
et al. en 1990; 

- la technique d ' amplification a la Q-beta-replicase , decrite 
par Miele et al . en 1983 et perf ectionnee notamment par Chu et 

10 al. en 1986, Lizardi et al. en 1988, puis par Burg et al , 
ainsi que par Stone et al. en 1996. 

Dans le cas ou le polynucleotide cible a detecter est un 
ARN, par exemple un ARNm, on utilisera avantageusement , 
prealablement a la mise en oeuvre d'une reaction 

15 d ' amplification a l ! aide des amorces selon 1* invention ou a la 
mise en oeuvre d'un precede de detection a l'aide des sondes de 
1' invention, une enzyme de type transcriptase inverse afin 
d'obtenir un ADNc a partir de 1 1 ARN contenu dans I'echanillon 
biologique. L ' ADNc obtenu servira alors de cible pour les 

20 amorces ou les sondes mises en oeuvre dans le procede 
d ' amplification ou de detection selon 1' invention. 

La sonde de detection sera choisie de telle maniere a ce 
qu'elle hybride avec l'amplicon genere. Une telle sonde de 
detection aura avantageusement pour sequence une sequence d'au 

23 moins 12 nucleotides, en particulier d'au moins 15 

nucleotides, et de preference moins de 200 nucleotides. 

Des sondes nucleotidiques selon 1' invention sont 
specifiques pour detecter les mycobacteries appartenant au 
complexe de Mycobacterium tuberculosis, plus precisement du 

30 fait que ces mycobacteries possedent dans leur genome au moins 
une copie de polynucleotides selon 1 ' invention. Par les sondes 
specifiques selon 1' invention, on entend particulierement tout 
oligonucleotide hybridant avec la sequence nucleotidique d ! un 
polypeptide selon l 1 invention, plus particulierement tout 

35 oligonucleotide hybridant avec la sequence SEQ ID N°l codant 
pour le polypeptide DP428 de M. tuberculosis, et ne presentant 

pas de reaction d 1 hybridation croisee ou d 1 amplification (PCR) 
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avec des sequences presentes chez des mycobacteries 
n'appartenant pas au complexe de Mycobacterium tuberculosis . 

Les sondes nucl^otidiques selon 1' invention hybrident 
specif iquement avec une molecule d'ADN ou d'ARN de 
5 polynucleotide selon 1' invention, dans des conditions 
d 1 hybridation de forte stringence telles que donnees sous forme 
d 1 exemple precedemment . 

Les sequences non marquees peuvent etre utilisees 
directement comme sondes, cependant les sequences sont 

10 generalement marquees par un element radioactif ("P, 35 S, 3 H, 
l25 I) ou par une molecule non- radioactive (biotine, 
acetyl aminof luorene , digoxigenine , 5 - bromo - desoxyur idine , 
f luoresceine) pour obtenir des sondes utilisables pour de 
nombreuses applications . 

15 Des exemples de marquages non radioactifs de sondes sont 

decrits, par exemple, dans le brevet franyais N° 78.10975 ou 
par Urdea et al. ou par Sanchez- Pescador et al . en 1988. 

Dans ce dernier cas, on pourra aussi utiliser l'une des 
methodes de marquage decrites dans les brevets FR 2 422 956 et 

20 FR 2 518 755. La technique d 1 hybridation peut etre realisee de 
manieres diverses (Matthews et al . , 1988). La methode la plus 
generale consiste a immobiliser 1'acide nucleique extrait des 
cellules de mycobacteries sur un support (tel que 
nitrocellulose, nylon, polystyrene) et a incuber, dans des 

25 conditions bien definies, l'acide nucleique cible immobilise 
avec la sonde. Apres 1 1 hybridation, l'exces de sonde est 
elimine et les molecules hybrides formees sont detectees par la 
methode appropriee (mesure de la radioactivite, de la 
fluorescence ou de l'activite enzymatique liee a la sonde). 

30 Avantageusement , les sondes nucleotidiques marquees selon 

1' invention peuvent avoir une structure telle qu'elles rendent 
possible une amplification du signal radioactif ou non- 
radioactif. Un systeme d * amplification repondant a la 
definition ci-dessus comprendra des sondes de detection sous la 

35 forme d'un ADN ramifie, branche (« branched DNA ») telles que 
celles decrites par Urdea et al. en 1991. Selon cette 
technique, on utilisera avantageusement plusieurs types de 
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sondes notamment une sonde de capture, afin d 1 immobiliser l'ADN 
ou I'ARN cible sur un support, et une sonde de detection. La 
sonde de detection lie un ADN « branche » presentant une 
structure ramifiee. L'ADN branche, a son tour, est capable de 
5 fixer des sondes oligonucleotidiques qui sont elles-memes 
coupl6es ^ des molecules de phosphatase alcaline. Puis 
l'activite de cette enzyme est mise en evidence grace a un 
substrat chimioluminescent , par exemple un derive du dioxetane- 
phosphate , 

10 Selon un autre mode avantageux de mise en oeuvre des 

sondes nucleiques selon 1' invention, ces derniSres peuvent etre 
utilisees comme sondes de capture. Dans ce cas, une sonde, dite 
<k sonde de capture », est immobilisee sur un support de maniere 
covalente ou non covalente et sert a capturer par hybridation 

15 spScifique l'acide nucleique cible obtenu a partir de 
1 'echantillon biologique a tester. Si necessaire, le support 
solide est separe de 1 1 echantillon et le duplex forme entre la 
sonde de capture et I'acide nucleique cible est ensuite detecte 
grace a une seconde sonde, dite « sonde de detection », marquee 

20 par un element facilement detectable. 

Les fragments oligonucleotidiques peuvent etre obtenus a 
partir des sequences selon 1' invention, par coupure avec des 
enzymes de restriction, ou par synthese chimique selon les 
methodes classiques, par exemple selon la methode decrite dans 

25 le brevet europeen N° EP-0305929 (Millipore Corporation) ou 
encore par d'autres procedes. 

Un mode de preparation approprie des acides nucleiques de 
1* invention comportant au maximum 200 nucleotides (ou 200 pb 
s'il s'agit d 1 acides nucleiques bicatenaires) comprend les 

30 etapes suivantes : 

- la synthese d 1 ADN en utilisant la methode automat isee des 
beta-cyanethylphosphoramidite decrite en 1986, 

- le clonage des acides nucleiques ainsi obtenus dans un 
vecteur approprie et la recuperation de I'acide nucleique par 

35 hybridation avec une sonde appropriee. 

Un mode de preparation, . par voie chimique, d 1 acides 
nucleiques selon l 1 invention de longueur superieure a 200 
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nucleotides (ou 200 pb lorsqu f il s'agit d'acides nucleiques 
bicatenaires) comprend les etapes suivantes : 

1* assemblage d 1 oligonucleotides synthetises chimiquement , 
pourvus a leur extremite de sites de restrictions differents, 
dont les sequences sont compatibles avec 1 ' enchainement en 
acides amines du polypeptide naturel selon le principe decrit 
en 1983, 

- le clonage des acides nucleiques ainsi obtenus dans un 
vecteur approprie et la recuperation de l'acide nucleique 
recherche par hybridation avec une sonde appropriee. 

Les sondes nucleotidiques utilisees pour la recuperation 
de l'acide nucleique recherche dans les procedes sus- 
mentionnes, sont constitutes generalement de 8 a 200 
nucleotides de la sequence de polypeptide selon 1 1 invention et 
sont susceptibles de s f hybrider avec l'acide nucleique 
recherche dans les conditions d 1 hybridation definies 
precedemment . La synthese de ces sondes peut etre effectuee 
selon la methode automatisee des beta cyanethylphosphoramidites 
decrite en 1986 . 

Les sondes oligonucleotidiques selon 1' invention peuvent 
etre mises en oeuvre au sein d'un dispositif de detection 
comprenant une banque matricielle d 1 oligonucleotides . Un 
exemple de realisation d'une telle banque matricielle peut 
consister en une matrice d ' oligonucleotides sondes fixes su'r un 
support, la sequence de chaque sonde d'une longueur donnee 
etant situee en decalage d'une ou plusieurs bases par rapport a 
la sonde precedente, chacune des sondes de 1 1 arrangement 
matriciel etant ainsi complementaire d'une sequence distincte 
de I'ADN ou l'AJRN cible a detecter et chaque sonde de sequence 
connue etant fixee en une position predeterminee du support. La 
sequence cible a detecter peut etre avantageusement marquee 
radioactivement ou non radioactivement . Lorsque la sequence 
cible marquee est mise en contact avec le dispositif matriciel, 
celle-ci forme des hybrides avec les sondes de sequences 
complementaires . Un traitement a la nuclease, suivi d'un 
lavage, permet d'eliminer les hybrides sondes -sequence cible 
qui ne sont pas parfaitement complementaires. Du fait de la 
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connaissance precise de la sequence d'une sonde a une position 
determinee de la matrice, il est alors possible de deduire la 
sequence nucleotidique de la sequence d 1 ADN ou d'ARN cible. 
Cette technique est particulierement efficace lorsque sont 
5 utilisees des matrices de sondes oligonucleotidiques de grande 
taille . 

Une alternative a 1 1 utilisation d'une sequence cible 
marquee peut consister en 1 1 utilisation d'un support permettant 
une detection <a bioelectronique » de 1 1 hybridation de la 

10 sequence cible sur les sondes du support matrice, lorsque que 
ledit support est const itue ou comprend un materiau capable 
d'agir, par exemple, en tant que donneur d' electrons aux 
positions de la matrice auxquelles un hybride a ete forme. Un 
tel materiau donneur d ' electron est par exemple de 1 ' or . La 

15 detection de la sequence nucleotidique de 1 ' ADN ou ARN cible 
est alors determinee par un dispositif electronique . 

Un exemple de realisation d'un biocapteur, tel que defini 
ci-dessus, est decrit dans la demande de brevet europeen N° EP- 
0721 016 au nom de Affymax technologies N.V. ou encore dans le 

20 brevet americain N° US 5.202.231 au nom de Drmanac. 

L 1 invention a aussi pour objet les polynucleotides 
hybrides resultant : 

- soit de la formation d'une molecule hybride entre un ARN ou 
un ADN (ADN genomique ou ADNc) provenant d'un echantillon 

25 biologique avec une sonde ou une amorce selon 1' invention. 

- soit de la formation d'une molecule hybride entre un ARN ou 
un ADN (ADN genomique ou ADNc) provenant d'un echantillon 
biologique avec un fragment nucleotidique amplifie a I'aide 
d'un couple d 1 amorces selon l 1 invention. 

30 Par ADNc au sens de la present e invention, on en tend une 

molecule d 1 ADN obtenue en faisant agir une enzyme de type 
transcriptase inverse sur une molecule d'ARN, en particulier 
une molecule d 1 ARN messager (ARNm) , selon les techniques 
decites dans Sambrook et al. en 1989. 

35 La presente invention a egalement pour objet une famille 

de plasmides recombines, caracterises en ce qu'ils contiennent 
au moins une sequence nucleotidique de polynucleotide selon 
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1' invention. Selon un mode de realisation avantageux dudit 
plasmide, il comprend la sequence nucleotidique SEQ ID N°l ou 
un fragment de celle-ci. 

Un autre objet de la presente invention est un vecteur 
5 pour le clonage, 1 ' expression et/ou 1 'insertion d'une sequence, 
caracterise en ce qu'il comprend une sequence nucleotidique de 
polynucleotide selon 1' invention en un site non essentiel pour 
sa replication, le cas echeant sous le controle d' elements de 
regulation susceptibles d'intervenir dans l'expression du 
10 polypeptide DP428, chez un hote determine. 

Des vecteurs particuliers sont par exemple des plasmides, 
des phages, des cosmides, des phagemides, des YAC. 

Ces vecteurs sont utiles pour transformer des cellules 
hotes afin de doner ou d'exprimer les sequences nucleotidiques 
15 de 1' invention. 

L* invention comprend egalement les cellules hotes 
transformers par un vecteur selon 1' invention. 

De preference, les cellules hotes sont transformers dans 
des conditions permettant 1 'expression d'un polypeptide 
20 recombinant selon l r invention. 

Une cellules hote preferee selon 1' invention est une 
mycobacterie appartenant a une souche de M. tuberculosis, 
M.bovis ou M.africanum possedant potentiellement tous les 
systemes de regulation appropries. 
2 s II est aujourd'hui facile de produire des proteines ou 

polypeptides en quantite relativement importante par genie 
genetique en utilisant comme vecteurs d' expression des 
plasmides, des phages, des phagemides. Tout ou partie du gene 
DP428, ou tout polynucleotide selon 1' invention, peut etre 
30 insere dans un vecteur d f expression approprie pour produire in 
vitro un polypeptide selon 1' invention, notamment le 
polypeptide DP428. Ledit polypeptide pourra etre fixe sur une 
microplaque pour developper un test serologique destine a 
rechercher, dans un but de diagnostic, les anticorps 
35 specif iques chez les patients atteints de tuberculose. 
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Ainsi, la presente invention concerne plus 
particulierement un procede de preparation d'un polypeptide de 
l 1 invention comprenant les etapes suivantes : 

le cas echeant, 1 1 amplification prealable suivant la 
5 technique PCR de la quantity de sequences de nucleotides codant 
pour ledit polypeptide a l'aide de deux amorces d'ADN choisies 
de maniere a ce que l'une de ces amorces soit identique aux 10 
a 25 premiers nucleotides de la sequence nucleotidique codant 
pour ledit polypeptide, tandis que 1 'autre amorce est 

10 complementaire des 10 a 25 derniers nucleotides (ou s'hybride 
avec ces 10 a 25 derniers nucleotides) de ladite sequence 
nucleotidique, ou inversement de maniere a ce que l'une de ces 
amorces soit identique aux 10 a 25 derniers nucleotides de 
ladite sequence, tandis que l 1 autre amorce est complementaire 

15 des 10 a 25 premiers nucleotides (ou s'hybride avec les 10 a 25 
premiers nucleotides) de ladite sequence nucleotidique, suivie 
de 1 ' introduction desdites sequences ainsi amplifiees dans un 
vecteur approprie, 

- la mise en culture, dans un milieu de culture approprie, d'un 
20 hote cellulaire prealablement transforme par un vecteur 

approprie contenant un acide nucleique selon l 1 invention 
comprenant la sequence nucleotidique codant pour ledit 
polypeptide, et 

- la separation, a partir du susdit milieu de culture, dudit 
25 polypeptide produit par ledit hote cellulaire transforme. 

L' invention a aussi pour objet un polypeptide, caracterise 
en ce qu'il est susceptible d'etre obtenu par un procede de 
1' invention tel que decrit precedemment . 
30 Les peptides selon 1' invention peuvent egalement etre 

prepares par les techniques classiques, dans le domaine de la 
synthese des peptides. Cette synthese peut etre realisee en 
solution homogene ou en phase solide. 

Par exemple, on aura recours a la technique de synthese en 
35 solution homogene decrite par Houbenweyl en 1974. 

Cette methode de synthese consiste a condenser 
successivement deux- a -deux les aminoacyles successif s dans 
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l'ordre requis, ou a condenser des aminoacyles et des fragments 
prealablement formes et contenant deja plusieurs aminoacyles 
dans l'ordre approprie, ou encore plusieurs fragments 
prealablement ainsi prepares, etant entendu que l'on aura eu 

5 soin de proteger au prealable toutes les f one t ions react ives 
portees par ces aminoacyles ou fragments, a 1' except ion des 
fonctions amines de 1 ' un et carboxyles de 1 ' autre ou vice- 
versa, qui doivent normalement intervenir dans la formation des 
liaisons peptidiques, notamment apres activation de la fonction 

10 carboxyle, selon les methodes bien connues dans la synthese des 
peptides. En variante, on pourra avoir recours a des reactions 
de couplage mettant en jeu des reactifs de couplage classique, 
du type carbodiimide, tels que par exemple la l-ethyl-3- (3- 
dimethyl-aminopropyl) -carbodiimide. 

15 Lorsque l'aminoacyle mis en oeuvre possede une fonction 

acide supplementaire (notamment dans le cas de l 1 acide 
glutamique) , ces fonctions seront protegees, par exemple par 
des groupes t-butylester . 

Dans le cas de la synthese progressive, acide amine par 

20 acide amine, la synthese debute de preference par la 
condensation de 1 1 amino-acide C-terminal avec 1 ' aminoacide qui 
correspond a 1 ' aminoacyle voisin dans la sequence desiree et 
ainsi de suite, de proche en proche, jusqu'a 1* acide amine N- 
terminal . 

25 Selon une autre technique preferee de 1' invention, on a 

recours a celle decrite par Merrifield. 

Pour fabriquer une chaine peptidique selon le procede de 
Merrifield, on a recours a une resine polymere tres poreuse, 
sur laquelle on fixe le premier acide amine C-terminal de la 

30 chaine. Cet acide amine est fixe sur la resine par 
1 1 intermediaire de son groupe carboxylique et se fonction amine 
est protegee, par exemple par le groupe t-butyloxycarbonyle . 

Lorsque le premier acide amine C-terminal est ainsi fixe 
sur la resine, on enleve le groupe protecteur de la fonction 

35 amine en lavant la resine avec un acide. 
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Dans le cas ou le groupe protecteur de la fonction amine 
est le groupe t-butyloxycarbonyle, il peut etre elimine par 
traitement de la resine a l'aide d'acide trif luoroacetique . 

On couple ensuite le deuxieme acide amine qui fournit le 
5 second aminoacyle de la sequence recherchee, a partir du residu 
aminoacyle C-terminal sur la fonction amine deprotegee du 
premier acide amine C-terminal fixe sur la chaine . De 
preference, la fonction carboxyle de ce deuxieme acide amine 
est activee, par exemple par la dicyclohexylcarbodiimide, et la 
10 fonction amine est protegee, par exemple par le t- 
butyloxycarbonyle . 

On obtient ainsi la premiere partie de la chaine 
peptidique recherchee, qui comporte deux acides amines, et dont 
la fonction amine terminale est protegee. Comme precedemment , 
15 on deprotege la fonction amine et on peut ensuite proceder a la 
fixation du troisieme aminoacyle, dans des conditions analogues 
a celles de l 1 addition du deuxieme acide amine C-terminal. 

On fixe ainsi, les uns apres les autres, les acides amines 
qui vont constituer la chaine peptidique sur le groupe amine 
20 chaque fois deprotege au prealable de la portion de la chaine 
peptidique deja formee, et qui est rattachee a la resine. 

Lorsque la totalite de la chaine peptidique desiree est 
formee, on elimine les groupes protecteurs des differents 
acides amines constituant la chaine peptidique et on detache le 
25 peptide de la resine, par exemple a l'aide d'acide 
f luorhydrique . 

De maniere pref erentielle, lesdits polypeptides 
susceptibles d'etre obtenus par un procede de 1' invention tel 
que decrit precedemment comprendront une region exposee au 
30 solvant et auront une longueur d'au moins 20 acides amines* 

Selon un autre mode de realisation de 1* invention, lesdits 
polypeptides sont specifiques de mycobacteries du complexe 
iVfycojbacteriujn tuberculosis et ne sont done pas reconnus par des 

anticorps specifiques d 1 autres proteines de mycobacteries. 
35 L 1 invention est en outre relative a des polypeptides 

hybrides presentant au moins un polypeptide selon l 1 invention 
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et une sequence d'un polypeptide susceptible d'induire une reponse 
inununitaire chez l'homme ou 1' animal. 

Avantageusement, le determinant antigenique est tel qu'il est 
susceptible d'induire une reponse humorale et/ou cellulaire, comme par 
5 exemple les determinants antigeniques de proteines immunogenes 
selectionnees par exemple parmi ESAT 6 et DES de 45/47 kD de Mycobacterium 
t ubercul osis. 

Un tel determinant pourra comprendre un polypeptide selon 1 ' invention 
sous forme glycosyl£e utilise en vue d'obtenir des compositions immunogenes 
10 susceptibles d'induire la synthese d'anticorps dirig£s contre des epitopes 
multiples. Lesdits polypeptides glycosyl£s font egalement partie de 
1 ' invention . 

Ces molecules hybrides peuvent §tre constitutes en partie d'une 
molecule porteuse de polypeptide selon 1' invention associee a une partie, 

15 en particulier un Epitope de la toxine diphterigue, la toxine tetanique, un 
antigene de surface du virus de 1' hepatite B (brevet FR 79 21811) , 
1' antigene VP1 du virus de la poliomyelite ou toute autre toxine ou 
antigdne viral ou bacterien. 

Avantageusement, un antigene bacterien tel que defini ci-dessus sera 

20 tout ou partie de la proteine immunogene de 45/47 kD de M, tuberculosis 
(demande internationale PCT/FR 96/0166) . 

Un antigene viral, tel que defini ci-dessus, sera pref erentiellement 
une proteine de surface ou d'enveloppe d'un virus de 1' hepatite, par 
exemple la proteine de surface de 1' hepatite B sous l'une de ses formes S, 

25 S-presi, S-preS2 ou S-preS2-preSl ou encore une proteine d'un virus de 
1'hepatite A, ou d'une hepatite non-A, non-B, tel qu'un virus de l'hepatite 
C, E ou delta. 

Plus particulierement, un antigene viral tel que defini ci-dessus 
sera tout ou partie de l'une des glycoproteines codees par le genome du 

30 virus HIV-l (brevets GB 8324800, EP 84401834 ou EP 85905513) ou du virus 
HIV-2 (EP 87400151), et en particulier tout ou partie d'une proteine 
selectionnee parmi gag, pol, nef ou env de HIV-l ou de HIV-2. 

Les proc£des de synthese des molecules hybrides englobent les 
met nodes utilis€es en genie genet ique pour cons tru ire des ADN hybrides 

35 codant pour les sequences polypeptidiques recherchees. On pourra, par 
exemple, se ref£rer avantageusement a la technique d'obtention de genes 
codant pour des proteines de fusion decrite par Minton en 1984. 
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Les polynucleotides hybrides codant pour un polypeptide hybride ainsi 
que les polypeptides hybrides selon 1 • invention caracterises en ce qu'il 
s'agit de proteines recombinantes obtenues par 1* expression desdits 
polynucleotides hybrides, font egalement partie de 1' invention. 
5 Les polypeptides selon 1' invention peuvent avantageusement Stre mis 

en oeuvre dans un procede de detection in vitro d'anticorps diriges contre 
lesdits polypeptides, notamment le polypeptide DP428, et ainsi contre une 
bacterie du complexe M. tuberculosis dans un €chantillon biologique (tissu 
ou fluide biologique) susceptible de les contenir, ce proc6de" comprenant la 

10 mise en contact de cet echantillon biologique avec un polypeptide selon 
1' invention dans des conditions permettant une reaction immunologique in 
vitro entre ledit polypeptide et les anticorps eventuellement presents dans 
1 ' echantillon biologique, et la detection in vitro des complexes antigene- 
anticorps eventuellement formes* 

15 De preference, 1 ' echantillon biologique est constitue par 

un fluide, par exemple un serum humain ou animal. 

Toute procedure classique peut etre raise en oeuvre pour 
realiser une telle detection. 

A titre d 1 exemple, une methode preferee met en jeu des 

20 processus immunoenzymatiques selon la technique ELISA, par 
immunofluorescence, ou radio- immunologique (RIA) ou equivalent. 

Ainsi, 1' invention concerne egalement les polypeptides 
selon 1' invention, marques a l'aide d'un marqueur adequat tel 
que du type enzymatique, fluorescent, radioactif . 

25 De telles methodes comprennent par exemple les etapes 

suivantes : 

depot de quant ites determines d'une composition 
polypeptidique selon 1" invention dans les puits d'une plaque de 
microtitration, 

30 - introduction dans lesdits puits de dilutions croissantes du 
serum devant etre analyse, 

- incubation de la microplaque, 

- introduction dans les puits de la plaque de microtitration 
d'anticorps marques diriges contre des immunoglobulines 

35 humaines ou animales, le marquage de ces anticorps ayant 6te 
realise a 1 1 aide d'une enzyme selectionnee parmi celles qui 
sont capables d'hydrolyser un substrat en modifiant 
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1 ' absorption des radiations de ce dernier, au moins a une 
longueur d'onde determinee, par exemple a 550 nm, 
-detection, en comparaison avec un temoin de controle, de la 
quantite de substrat hydrolyse. 
5 L ■ invention concerne egalement un necessaire ou kit pour 

le diagnostic in vitro d'une infection par une mycobacterie 
appartenant au complexe Mycobacterium tuberculosis, comprenant : 

- un polypeptide selon I 1 invention, 

- les reactifs pour la constitution du milieu propice a la 
10 reaction immunologique, 

- les reactifs permettant la detection des complexes antigene- 
anticorps produits par la reaction immunologique, ces reactifs 
peuvent egalement porter un marqueur, ou etre susceptibles 
d'etre reconnus a leur tour par un react if marque, plus 

15 particulierement dans le cas ou le polypeptide selon 
1' invention n'est pas marque, 

le cas echeant, un echantillon biologique de reference 
(temoin negatif) depourvu d 1 anticorps reconnus par un 
polypeptide selon 1' invention, 

20 - le cas echeant, un echantillon biologique de reference 
(temoin positif) contenant une quantite predeterminee 
d'anticorps reconnus par un polypeptide selon 1' invention. 

Les polypeptides selon 1' invention permettent de preparer 
des anticorps monoclonaux ou polyclonaux caracterises en ce 

25 qu'ils reconnaissent specif iquement les polypeptides selon 
1' invention. Les anticorps monoclonaux pourront avantageusement 
etre prepares a partir d'hybridomes selon la technique decrite 
par Kohler et Milstein en 1975. Les anticorps polyclonaux 
pourront etre prepares, par exemple par immunisation d'un 

30 animal, en particulier une souris, avec un polypeptide selon 
1' invention associe a un adjuvant de la reponse immunitaire, 
puis purification des anticorps specifiques contenus dans le 
serum des animaux immunises sur une colonne d'af finite sur 
laquelle a prealablement ete fixe le polypeptide ayant servi 

35 d'antigene. Les anticorps polyclonaux selon 1' invention peuvent 
aussi etre prepares par purification sur une colonne 
d'af finite, sur laquelle a prealablement ete immobilise un 
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polypeptide selon 1' invention, des anticorps contenus dans le 
serum de patients infectes par une mycobacterie appartenant au 
complexe Mycobacterium tuberculosis . 

L» invention a egalement pour objet des anticorps mono ou 
5 polyclonaux ou leurs fragments, ou anticorps chimeriques, 
caracterises en ce qu'ils sont capables de reconnaxtre 
specif iquement un polypeptide selon 1' invent ion. 

Les anticorps de 1' invention pourront egalement etre 
marques de la meme maniere que decrit precedemment pour les 
10 sondes nucleiques de 1" invention tel qu'u marquage de type 
enzymatique, fluorescent ou radioactif . 

L' invention vise en outre un procede pour la detection 
specif ique de la presence d'un antigene d r une bacterie du 
15 complexe Mycobacterium tuberculosis dans un echantillon 

biologique, caracterise en ce qu'il comprend les etapes 
suivantes : 

a) Mise en contact de 1 1 echantillon biologique (tissu ou fluide 
biologique) preleve chez un individu avec un anticorps mono ou 

20 polyclonal selon 1 ' invention , dans des conditions permettant 
une reaction immunologique in vitro entre lesdits anticorps et 
les polypeptides specifiques des mycobacteries du complexe de 
Mycobacterium tuberculosis eventuellement presents dans 
1 ' echantillon biologique, et 

25 b) Mise en evidence du complexe antigene-ant icorps forme. 

Entre egalement dans le cadre de l 1 invention, un 
necessaire ou kit pour le diagnostic in vitro sur un 
echantillon biologique, de la presence de souches de 
30 mycobacteries appartenant au complexe de Mycobacterium 

tuberculosis , de preference M. tuberculosis , caracterise en ce 
qu'il comprend : 

- un anticorps polyclonal ou monoclonal selon 1' invention, le 
cas echeant marque; 
35 - le cas echeant, un reactif pour la constitution du milieu 
propice a la realisation de la reaction immunologique; 
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- un react if permettant la detection des complexes antigene- 
anticorps produits par la reaction immunologique r ce reactif 
pouvant egalement porter un marqueur, ou etre susceptible 
d'etre reconnu a son tour par un reactif marque, plus 
5 particulierement dans le cas ou ledit anticorps monoclonal ou 
polyclonal n'est pas marque. 

le cas echeant, des react if s pour effectuer la lyse des 

cellules de 1 1 echantillon teste. 

10 

La presente invention a egalement pour objet un 
procede de detection et d' identification rapide de M. 

tuberculosis dans un echantillon biologique, caracterise en 

ce qu'il comporte les etapes suivantes : 
15 a) Isolement de l'ADN a partir de 1 1 echantillon biologique a 
analyser, ou obtention d'un ADNc a partir de 1 1 ARN de 
1 ' echantillon biologique ; 

b) Amplification specif ique de l'ADN des mycobacteries 
appartenant au complexe Mycobacterium tuberculosis a 1'aide 

20 d'amorces selon 1' invention; 

c) Analyse des produits d ' amplification . 

Ceux-ci peuvent etre analyses par differentes methodes. 
Deux methodes d 1 analyse sont donnees a titre d'exemple ci- 
dessous : 

25 - Analyse electrophoretique en gel d' agarose des produits 

d 1 amplification. Si l'on observe la presence d'un fragment 
d'ADN migrant a I'endroit attendu, on peut conclure que 
1 ' echantillon analyse contenait de l'ADN de mycobacteries 
appartenant au complexe tuberculosis, ou 

30 - Analyse par la technique d' hybridation moleculaire en 

utilisant une sonde nucleique selon 1' invention. Cette sonde 
sera avantageusement marquee par un element non radioactif 
(sonde froide) ou radioactif. 

Aux fins de la presente invention, on entendra par « ADN 

35 de 1 'echantillon biologique » ou « ADN contenu dans 
1 ' echantillon biologique », soit l'ADN present dans 
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1 echantillon biologique considere, soit l'ADNc obtenu apres 
1' act ion d'une enzyme de type transcriptase inverse sur l'ARN 
present dans ledit echantillon biologique. 

Un autre but de la presente invention consiste en un 
5 procede pour la detection specifique de bacteries appartenant 
au complexe Mycobacterium tuberculosis dans un echantillon 
biologique, caracterise en ce qu'il comprend les etapes 
suivantes : 

a) Mise en contact d'une sonde oligonucleotidique selon 
10 1 ! invention avec un echantillon biologique, l'ADN contenu dans 

1 'echantillon biologique, ou l'ADNc obtenu par transcription 
inverse de l'ARN de 1 1 echantillon biologique, ayant, le cas 
echeant, prealablement ete rendu accessible a 1 1 hybridation, 
dans des conditions permettant 1 * hybridation de la sonde a 
15 l'ADN ou l ! ADNc d'une bacterie du complexe Mycobacterium 

tuberculosis ; 

b) Detection de 1 ' hybride forme entre la sonde 
oligonucleotidique et l'ADN de 1 ' echantillon biologique. 

20 L* invention vise egalement un procede pour la detection 

specifique de bacteries appartenant au complexe Mycobacterium 
tuberculosis dans un echantillon biologique, caracterise en ce 
qu'il comprend les etapes suivantes : 

a) Mise en contact d'une sonde oligonucleotidique selon 
25 1' invention immobilisee sur un support, avec un echantillon 
biologique, 1 1 ADN de 1 1 echantillon biologique ayant, le cas 
echeant, ete prealablement rendu accessible a 1 1 hybridation, 
dans des conditions permettant 1 1 hybridation de ladite sonde a 
l'ADN d'une bacterie du complexe Mycobacterium tuberculosis; 
50 b) Mise en contact de 1' hybride forme entre ladite sonde 
oligonucleotidique immobilisee sur un support et l'ADN contenu 
dans 1 ' echantillon biologique, le cas echeant apres elimination 
de l'ADN de 1 ' echantillon biologique n ! ayant pas hybride avec 
la sonde, avec une sonde oligonucleotidique marquee selon 
35 1' invention. 
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Selon un mode de realisation avantageux du procede de 
detection defini precedemment , celui-ci est caracterise en ce 
que, prealablement a l'etape a), l'ADN de 1 ' echantillon 
biologique est prealablement amplifie a l'aide d'un couple 
5 d' amorces selon 1' invention. 

Une autre forme de mise en oeuvre du procede de detection 
selon 1 ' invention consiste en un procede pour la detection 
specif ique de la presence d'une bacterie appartenant au 
complexe de Mycobacterium tuberculosis dans un echantillon 

10 biologique, caracterise en ce qu'il comprend les etapes 
suivantes : 

a) Mise en contact de 1 1 echantillon biologique avec un couple 
d' amorces selon 1* invention, l'ADN contenu dans 1 ' echantillon 
ayant ete, le cas echeant, prealablement rendu accessible a 

15 1-* hybridation, dans des conditions permettant une hybridation 
desdites amorces a l'ADN d'une bacterie du complexe 
Mycoba c t era urn tubercul osis; 

b) Amplification de l'ADN de la bacterie du complexe 
Mycoba c t eri urn t uberc ulosis; 

20 c) mise en evidence de 1 1 amplification de fragments d'ADN 
correspondant au fragment encadre par les amorces, par exemple 
par electrophorese sur gel ou au moyen d'une sonde 
oligonucleotidique selon invention . 

25 L' invention a aussi pour objet un procede pour la detection 

specif ique de la presence d'une bacterie appartenant au 
complexe de Mycobacterium tuberculosis dans un echantillon 

biologique par deplacement de brin, caracterise en ce qu'il 
comprend les etapes suivantes : 

30 a) Mise en contact de 1 1 echantillon biologique avec deux 
couples d* amorces selon 1' invention specif iquement destinees a 
1 'amplification de type SDA decrites ci-dessus, l'ADN contenu 
dans 1 'echantillon ayant ete, le cas echeant, prealablement 
rendu accessible a 1 * hybridation, dans des conditions 

35 permettant une hybridation des amorces a l'ADN d'une bacterie 
du complexe Mycobacterium tuberculosis; 
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b) amplification de l'ADN de la bacterie du complexe 
Mycobacterium tuberculosis ; 

c) mise en evidence de 1 1 amplification de fragments d'ADN 
correspondant au fragment encadre par les amorces, par exemple 

5 par electrophorese sur gel ou au moyen d'une sonde 
oligonucleotidique selon l 1 invention. 

L' invention concerne aussi un necessaire ou kit pour la 
mise en oeuvre du procede decrit ci-dessus, destine a la 
detection de la presence d'une bacterie du complexe 
10 Mycobacterium tuberculosis dans un echantillon biologique, 

caracterise en ce qu'il comprend les elements suivants ; 

a) Une sonde oligonucleotidique selon 1' invention; 

b) Les react if s necessaires a la mise en oeuvre d'une reaction 
d 1 hybridation; 

15 c) Le cas echeant, un couple d' amorces selon 1' invention ainsi 
que les reactifs necessaires a une reaction d ' amplification de 
l'ADN (ADN genomique, ADN plasmidique ou ADNc) d'une bacterie 
du complexe Mycobacterium tuberculosis . 

L' invention a aussi pour objet un kit ou necessaire pour 
20 la detection de la presence d'une bacterie du complexe 
Mycobacterium tuberculosis dans un echantillon biologique, 

caracterise en ce qu'il comprend les elements suivants : 

a) Une sonde oligonucleotidique, dite sonde de capture, selon 

1 1 invention; 

25 b) Une sonde oligonucleotidique, dite sonde de revelation, selon 
1' invention. 

c) Le cas echeant, un couple d 1 amorces selon 1' invention ainsi 
que les reactifs necessaires a une reaction d ' amplification de 
l'ADN d'une bacterie du complexe Mycobacterium tuberculosis. 

30 L 1 invention concerne encore un kit ou necessaire pour 

1 * amplification de l'ADN d'une bacterie du complexe 
Mycobacterium tuberculosis present dans un echantillon 

biologique, caracterise en ce qu'il comprend les elements 
suivants : 

35 a) Un couple d'amorces selon l'invention; 
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b) Les reactifs necessaires pour effectuer une reaction 
d ■ amplification d'ADN; 

c) Eventuellement un composant permettant de verifier la 
sequence du fragment amplifie, plus particulierement une sonde 

5 oligonucleotidique selon 1' invention. 

Un autre objet de la presente invention concerne une 
composition immunogene, caracterisee en ce qu'elle comprend 
polypeptide selon 1* invention. 

Une autre composition immunogene selon l 1 invention est 
10 caracterise en ce qu'elle comprend un ou plusieurs polypeptides 
selon 1' invention et/ou une ou plusieurs proteines hybrides 
selon 1 1 invention . 

Selon un mode de realisation avantageux, la composition 
immunogene ci-dessus definie est constitutive d'un vaccin, 
15 lorsqu'elle est presentee en association avec un vehicule 
pharmaceutiquement acceptable et eventuellement un ou plusieurs 
adjuvants de 1 ' immunite tels que I'alun ou un representant de 
la famille des muramyl peptides ou encore 1' adjuvant incomplet 
de Freund. 

20 Aujourd'hui, divers types vaccins sont disponibles 

pour prot£ger 1 • homme contre des maladies infectieuses : 
micro-organismes vivants attenues (W. bovis - BCG pour la 
tuberculose) , micro-organismes inactives (virus de la grippe) , 
des extraits acellulaires {Bordetella pertussis pour la 

25 coqueluche) , proteines recombinees (antigene de surface du 
virus de 1* hepatite B) , des polyosides (pneumocoques) . Des 
vaccins prepares a partir de peptides de synthese ou de micro- 
organismes genet iquement modifies exprimant des antigenes 
heterologues sont en cours d' experimentation. Plus recemment 

30 encore, des ADN plasmidiques recombines portant des genes 
codant pour des antigenes protecteurs ont ete proposes comme 
strategie vaccinale alternative. Ce type de vaccination est 
realise avec un plasmide particulier derivant d'un plasmide de 
E. coli qui ne se replique pas in vivo et qui code 

35 uniquement pour la proteine vaccinante. Les principaux 
composants fonctionnels de ce plasmide sont : un promoteur 
fort (par exemple celui du CMV) , un site de clonage approprie 
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pour inserer le gene d'interet, une sequence de terminaison- 
polyadenylation, une origine de replication procaryote pour 
produire le plasmide recombine in vitro et un marqueur de 
selection (par exemple le gene de resistance a 1 1 ampicilline) 
5 pour faciliter la selection des bacteries qui contiennent le 
plasmide. Des animaux ont ete immunises en inject ant 
simplement l'ADN plasmidique nu dans le muscle. Cette 
technique conduit a 1' expression de la proteine vaccinale in 

situ et a une reponse immunitaire de type cellulaire (CTL) et 

10 de type humoral (anticorps) . Cette double induction de la 
reponse immunitaire est l'un des principaux avantages de la 
technique de vaccination avec de I'ADN nu. Huygen et al . 
(1996) et Tascon et al . (1996) ont reussi a obtenir une 
certaine protection contre Af. tuberculosis en injectant des 

15 plasmides recombines contenant des genes de M. leprae (hspSS, 

36kDa pra ) comme inserts. M. leprae est 1* agent responsable 

de la lepre. L ' utilisation d'un insert specif ique de Af. 

tuberculosis comme par exemple tout ou partie du gene DP428, 

objet de la presente invention conduirait probablement a une 
20 meilleure protection contre la tuberculose. Tout ou partie du 
gene DP428, ou tout polynucleotide selon 1' invention, peut 

etre facilement insere dans le.s plasmides vecteurs V1J 
(Montgomery et al , 1993), pcDNA3 (Invitrogen, R&D Systems) 
ou pcDNAl/Neo (Invitrogen) qui possedent les caracteristiques 

25 necessaires pour une utilisation vaccinale. 

L' invention vise ainsi une composition immunogene 
caracterisee en ce qu f elle comprend un ou plusieurs 
polypeptides hybrides tels que precedemment definis en 
association avec un vehicule pharmaceutiquement compatible et, 

30 le cas echeant, un ou plusieurs adjuvants de l r immunite. 

L 1 invention vise aussi une composition vaccinale destinee 
a 1 1 immunisation de l'homme ou 1' animal a l'encontre d'une 
infection bacterienne ou virale, telle que la tuberculose ou 
1' hepatite, caracterisee en ce qu'elle comprend un ou plusieurs 

35 polypeptides hybrides tels que precedemment definis en 
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association avec un vehicule pharmaceutiquement compatible et, 
le cas echeant, un ou plusieurs adjuvants de l'immunite. 

Avantageusement , dans le cas d'une proteine hybride entre 
un polypeptide selon 1' invention et l'antigene de surface de 
5 l 1 hepatite B, la composition vaccinale sera administree, chez 
l'homme, a raison de 0,1 a 1 /zg de proteine hybride purifiee 
par kilogramme du poids du patient, de preference 0,2 a 0,5 
ptg/kg de poids du patient, pour une dose destinee a une 
administration donnee. Dans le cas de patients atteints de 

10 troubles du systeme immunitaire, en particulier les patients 
immunodeprimes, chaque dose injectee contiendra 

pref erentiellement la moitie de la quantite ponderale de la 
proteine hybride contenue dans une dose destinee a un patient 
n'etant pas affecte de troubles du systeme immunitaire. 

15 De preference, la composition vaccinale sera administree a 

plusieurs reprises, de maniere etalee dans le temps, par voie 
intradermique ou sous-cutanee . A titre d'exemple, trois doses 
telles que definies ci-dessus seront respect ivement 
administrees au patient au temps tO, au temps to + 1 mois et au 

20 temps tO + 1 an. 

Al ternat ivement , trois doses seront respect ivement 
administrees au patient au temps to, au temps tO + 1 mois et au 
temps tO + 6 mois. 

Chez la souris, chez laquelle une dose ponderale de la 

25 composition vaccinale comparable a la dose utilisee chez 
l'homme est administree, la reaction anticorps est testee par 
prelevement du serum suivi d ! une etude de la formation d'un 
complexe entre les anticorps presents dans le serum et 
l'antigene de la composition vaccinale, selon les techniques 

30 usuelles. 

L 1 invention concerne egalement une composition immunogene 
caracterisee en ce qu 'elle comprend un polynucleotide ou un 
vecteur d 1 expression selon 1' invention, en association avec un 
vehicule permettant son administration a l'homme ou 1 ' animal . 
35 L' invention a encore pour objet un vaccin destine a 

1 ' immunisation a 1 ' encontre d'une infection bacterienne ou 
virale, caracterise en ce qu'il comprend un polynucleotide ou 
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un vecteur d* expression selon 1' invent ion, en association avec 
un vehicule pharmaceutiquement acceptable . 

De telles compositions immunogenes ou vaccinales sont 
notamment decrites dans la demande interna tionale N° WO 
5 90/11092 (Vical Inc.) et egalement dans la demande 
internationale N° WO 95/11307 (Institut Pasteur) . 

Le polynucleotide constitutif de la composition immunogene 
ou de la composition vaccinale selon 1' invention peut etre 
injecte a 1 ' hote apres avoir ete couple a des composes qui 
10 favorisent la penetration de ce polynucleotide a 1 1 interieur de 
la cellule ou son transport jusqu'au noyau cellulaire. Les 
conjugues resultants peuvent etre encapsules dans des 
microparticules polymeres, comme decrit dans la demande 
internationale N° WO 94/27238 (medisorb Technologies 
15 International) . 

Selon un autre mode de realisation de la composition 
immunogene et/ou vaccinale selon 1" invention, le 
polynucleotide, de preference un ADN, est complexe avec du 
DEAE-dextran (Pagano et al . , 1967) ou avec des proteines 
20 nucleaires (Kaneda et al., 1989), avec des lipides (Feigner et 
■al., 1987) ou encore encapsules dans des liposomes (Fraley et 
al. , 1980) . 

Selon encore un autre mode de realisation avantageux de la 
composition immunogene et/ou vaccinale selon 1' invention, le 

25 polynucleotide selon 1' invention peut etre introduit sous la 
forme d ! un gel facilitant sa transfection dans les cellules. 
Une telle composition sous forme de gel peut etre un complexe 
de poly-L-lysine et de lactose, comme decrit par Midoux en 
1993, ou encore le Poloxamer 407™, comme decrit par Pastore en 

30 1994. Le polynucleotide ou le vecteur selon l f invention peuvent 
aussi etre en suspension dans une solution tampon ou etre 
associes a des liposomes. 

Avantageusement , un tel vaccin sera prepare conformement a 
la technique decrite par Tacson et al . ou Huygen et al. en 1996 

35 ou encore conformement a la technique decrite par Davis et al. 
dans la demande internationale N° WO 95/11307 (Whalen et al.). 
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Un tel vaccin sera avantageusement prepare sous la forme 
d'une composition contenant un vecteur selon 1* invention, 
placee sous le controle d' elements de regulation permettant son 
expression chez 1 1 homme ou l 1 animal. 
5 Pour realiser un tel vaccin, le polynucleotide selon 

1' invention est tout d'abord sous-clone dans un vecteur 
d' expression approprie, plus particulierement un vecteur 
d' expression contenant des signaux de regulation et 
d 1 expression reconnus par les enzymes des cellules eucaryotes 
10 et contenant egalement une origine de replication active chez 
les procaryotes, par exemple chez E. coli, qui permet son 
amplification prealable. Puis le plasmide recombinant purifie 
obtenu est injecte a I'hote, par exemple par voie 
intramusculaire . 

15 On pourra par exemple utiliser, en tant que vecteur 

d 1 expression in vivo de l'antigene d'interet, le plasmide 
pcDNA3 ou le plasmide pcDNAl/neo, tous les deux commercialises 
par Invitrogen (R&D Systems, Abingdon, Royaume-Uni) . On peut 
aussi utiliser le plasmide VlJns.tPA, decrit par Shiver et al . 

20 en 1995. 

Un tel vaccin comprendra avantageusement, outre le vecteur 
recombinant, une solution saline, par exemple une solution de 
chlorure de sodium. 

Une composition vaccinale telle que definie ci-dessus sera 
25 par exemple administree par voie parenterale ou par voie 
intramusculaire . 

D'autres caracteristiques et avantages de l f invention 
apparaissent dans les exemples et les figures suivants : 

30 

FIGURES 

Figure 1 : 

1A. la construction pJVED: Plasmid navette( pouvant se 
35 multiplier chez les mycobacteries ainsi que chez E.coli) . 
avec un gene de resistance a la kanamycine (issu de Tn903) 
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comme marqueur de selection. Le gene phoA tronque(A phoA) 
et le gene luc forment un operon synthetique. 
IB. Sequence de la jonction entre phoA et luc. 
Figure 2 : 

5 Activites Luc et PhoA de M. smegmatis recombinant 
contenant le pJVED avec differents fragments 
nucleotidiques comme decrits en exemple . 
Figure 3 : 

Hybridation genomique (Southern blot) de I'ADN genomique 
10 de differentes especes mycobacteriennes a l'aide de la 
sonde correspondant aux fragments XXXXX de la sequence ID. 
Figure 4 : 

Representation de 1 ■ hydrophobic! te (Kyte et Doolitle) de 
la sequence codante du DP428 avec sa representation 
15 schematique. Le motif LPISG precede immediatement la 
region C-terminale hydrophobe. La sequence se termine par 
deux arginines. 
Figure 5 : 

Illustre la sequence SEQ ID N°l correspondant a 1 1 insert 
20 du vecteur pDP428 (depose a la CNCM sous le N° 1-1818) . 
Figure 6 : 

Illustre la sequence SEQ ID N°2 correspondant a la region 
incluant le gene codant pour le DP428 (region soulignee) . 
La figure fait apparaitre que le DP428 fait probablement 
25 partie d r un operon comprenant au moins trois genes. La 
region doublement encadree inclut probablement les regions 
promotrices . 

La region simplement encadree correspond au motif LPISG 
rapellant le motif LPXTG decrit chez les Gram positifs 
30 comme permettant I'ancrage aux peptidogluconnes . 
Figure 7 : 

Illustre la sequence SEQ ID N°3 correspondant a 1 ' insert 
du vecteur p6D7 (depose a 4a CNCM sous le N° 1-1814) . 
A,B et C representent les trois phases de lecture possible. 
35 Figure 8 : 
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Illustre la sequence SEQ 
du vecteur p5A3 (depose a 
A, B et C representent 
possible . 
5 Figure 9 : 

Illustre la sequence SEQ 
du vecteur p5F6 (depose £ 
A,B et C representent 
possible . 

10 Figure 10 : 

Illustre la sequence SEQ 
du vecteur p2A29 (depose a 
A,B et C representent 
possible . 

15 Figure 11 ; 

Illustre la sequence SEQ 
du vecteur p5B5 (depose a 
A,B et C representent 
possible . 

20 Figure 12 : 

Illustre la sequence SEQ 
du vecteur plC7 (depose a 
A, B et C representent 
possible . 

25 Figure 13 : 

Illustre la sequence SEQ 
du vecteur p2D7 (depose a 
A,B et C representent 
possible . 

30 Figure 14 : 

Illustre la sequence SEQ 
du vecteur plB7 (depose a 
A,B et C representent 
possible . 

35 Figure 15 : 

Illustre la sequence SEQ ! 



ID N°4 correspondant a 1 1 insert 
la CNCM sous le N° 1-1815) . 
les trois phases de lecture 

ID N°5 correspondant a 1 1 insert 
la CNCM sous le N° 1-1816) . 
les trois phases de lecture 

ID N°6 correspondant a 1 ' insert 
la CNCM sous le N° 1-1817) . 
les trois phases de lecture 

ID N°7 correspondant a 1 ' insert 
la CNCM sous le N° 1-1819) . 
les trois phases de lecture 

ID N°8 correspondant a 1 ' insert 
la CNCM sous le N° 1-1820) . 
les trois phases de lecture 

ID N°9 correspondant a 1 ' insert 
la CNCM sous le N° 1-1821) . 
les trois phases de lecture 

ID N°10 correspondant a 1 1 insert 
la CNCM sous le N° 1-1843) . 
les trois phases de lecture 

D N°ll. 
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A, B et C representent les trois 
possible . 
Figure 16 : 

Illustre la sequence SEQ ID N°12. 
5 A,B et C representent les trois 
possible . 
Figure 17 : 

Illustre la sequence SEQ ID N°13. 
A,B et C representent les trois 
iO possible. 
Figure 18 : 

Illustre la sequence SEQ ID N°14. 

A, B et C representent les trois 

possible . 
15 Figure 19 : 

Illustre la sequence SEQ ID N°15. 

A, B et C representent les trois 

possible . 

Figure 20 : 
20 Illustre la sequence SEQ ID N°16. 

A, B et C representent les trois 

possible . 

Figure 21 : 

Illustre la sequence SEQ ID N°17. 
25 A, B et C representent les trois 
possible. 
Figure 22 : 

Illustre la sequence SEQ ID N°18. 
A,B et C representent les trois 
30 possible. 

Figure 23 : 

Illustre la sequence SEQ ID N°19. 
A, B et C representent les trois 
possible . 
35 Figure 24 : 

Illustre la sequence SEQ ID N°20. 



phases de lecture 



phases de lecture 



phases de lecture 



phases de lecture 



phases de lecture 



phases de lecture 



phases de lecture 



phases de lecture 



phases de lecture 
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A, B et C representent les trois phases de lecture 
possible . 
Figure 2 5 : 

Illustre la sequence SEQ ID N°21. 
5 A, B et C representent les trois phases de lecture 
possible . 
Figure 26 : 

Illustre la sequence SEQ ID N°22. 

A,B et C representent les trois phases de lecture 
10 possible. 
Figure 27 : 

Illustre la sequence SEQ ID N°23. 

A, B et C representent les trois phases de lecture 
possible . 
15 Figure 28 : 

Illustre la sequence SEQ ID N°24. 

A, B et C representent' les trois phases de lecture 
possible . 
Figure 29 : 

20 Illustre les sequences SEQ ID N°25 et SEQ ID N°26 
representant un couple d 1 amorces utilisees pour amplifier 
specif iquement par PCR la region correspondant aux 
nucleotides 964 a 1234 inclus dans la sequence SEQ ID N°l. 



EXEMPLES 

Materiel et methodes 

30 

Cultures bacteriennes, plasmides et milieux de cultures 

Les cultures bacteriennes et plasmides utilisees dans 
ces exemples sont regroupees dans le tableau 1. E. coli a ete 
cultive sur milieu liquide ou solide Luria-Bertani (LB) . M. 
35 smegmatis a ete cultive sur milieu liquide Middlebrook 7H9 
(Difco) additionne de dextrose albumine (ADC), 0,2 % de 
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glycerole et 0,05 % de Tween, ou sur milieu solide L . Si 
necessaire, 1 1 antibiotique kanamycine a ete rajoute a une 
concentration de 20 /xg/ml" 1. Les clones bacteriens presentant 
une activite PhoA ont ete detectes sur de l'agar LB contenant 
5 du 5-bromo-4-chloro-3-indolyle phosphate (X-P, a 40 jig/ml- 1) . 

Manipulation d 1 ADN et sequen^age 

Les manipulations d'ADN et les analyses par Southern 
10 blot ont ete effectuees en utilisant les techniques standard 
(Sambrook, 1989). Les sequences d'ADN double brun ont ete 
determinees avec un kit de sequencpage Taq Dye Deoxy Terminator 
Cycle (Applied Biosystems) , dans un Systeme 9600 GeneAmp PCR 
(Perkin-Elmer) , et apres migration sur un systeme d'analyse ADN 
15 modele 373 (Applied Biosystems) . 

Constructions des plasmides 

Le plasmide pJVED a a ete construit a partir de pLA71, 
20 plasmide de transfert comportant le gene phoA tronque et place 
en phase avec BlaF, pLA71 a ete coupe avec les enzymes de 
restriction Kpnl et NotI, retirant ainsi phoA sans toucher le 
promoteur de BlaF. Le gene luc codant pour la luciferase de 
luciole a ete amplifie a partir de pGEM- luc et un site de 
2? liaison du ribosome a ete rajoute. phoA a ete amplifie a partir 
de pJEMll. Les fragments amplifies ont ete coupes avec PstI et 
ligatures ensemble. Les oligodeoxynucleotides utilises sont les 
suivants : 

pPV . luc . Fw : 5 ' GACTGCTGCAG AAGGAG AAGATCCAAATGG 3 ' 
30 luc.Bw : 5 ' GACTAGCGGCCGCGAATTCGTCGACCTCCGAGG3 ' 

pJEM.phoA.Fw : 5 ' CCGCGGATCCGGATACGTAC3 1 

phoA . Bw : 5 ' GACTGCTGCAGTTTATTTCAGCCCCAGAGCG3 1 . 

Le fragment ainsi obtenu a ete reamplifie en utilisant 

les oligonucleotides complementaires de ses extremites, coupe 
35 avec Kpnl et NotI, et integre dans pLA71 coupe avec les memes 
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enzymes. La construction resultante a ete electroporee dans E. 
coli DH5ct et M. smegmatis mc2 155. Un clone M. smegmatis 
emettant de la lumiere et presentant une activite phoA a ete 
selectionne et appele pJVED/b2aF_ L 1 insert a et6 retire en 
utilisant BanzHI et la construction refermee sur elle-meme, 
reconstruisant ainsi le pJVED a . Afin d'obtenir le pJVEDb /C , le 
multisite de clonage a ete coupe avec Seal et iCpnl et referme 
en enlevant un (pJVEDb) ou deux (pJVED c ) nucleotides du site 
SnaBI. Apres fusion six cadres de lecture ont pu ainsi etre 
obtenus. L 1 insert du pJVED/hspl8 a ete obtenu par amplification 
en chaine par polymerase (ACP) de pPM1745 (Servant, 1995) en 
utilisant des oligonucleotides de la sequence : 
1 8 . Fw : 5 ' GTACCAGTACTGATCACCCGTCTCCCGCAC3 ' 
18. Back : AGTCAGGTACCTCGCGGAAGGGGTCAGTGCG3 1 

Le produit a ete coupe avec Kpnl et Seal, et ligature a 

pJVED a , coupe avec les memes enzymes, quittant ainsi le 
pJVED/hspIS. 

Le pJVED/P19kDa et le pJVED/erp furent construits en 
coupant avec BawHI 1 ' insert de pExp410 et pExp53 
respect ivement, et en les inserant dans le site BarrHI du 
multisite de clonage de pJVED a . 



Mesure de 1- activite phosphatase alkaline 

M. smegmatis ont ete cultives dans un milieu LB 
additionnes de 0,05 % de Tween 80 (Aldrich) et de kanamycine 
(20 jig/ml- 1) a 37°C pendant 24 heures. L' activite de la 
phosphatase alkaline a ete mesuree par la methode de Brockman 
et Heppel (Brockman, 1968) dans un extrait sonique, avec p- 
nitrophenylphosphate comme substrat de la reaction. La quantite 
de proteines a ete mesuree par essai Bio-Rad. L 1 activite 
phosphatase alkaline est exprimee en unite arbitraire (densite 
optique a 420 nm x /zg de proteines- 1 x minutes- 1) . 
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Mesure de l'activite lucif erase 

M. smegmatis a et6 cultive dans un milieu LB additionne 
de 0,05 % de Tween 80 (Aldrich) et de kanamycine (20 fxg/ml- 1) 
a 37°C pendant 24 heures et utilise en pleine croissance 
exponentielle (DO & 600 nm comprise entre 0,3 et 0,8). Les 
aliquots de suspensions bacteriennes ont ete brievement 
soniques et l'extrait cellulaire a ete utilise pour mesurer 
l'activite de la lucif erase. 25 /il de 1'extrait sonique ont ete 
melanges avec 100 fil de substrat (systeme d'essai lucif erase 
Promega) automatiquement dans un luminometre et la lumiere 
emise exprimee en ULR (Unites Lumineuses Relatives) . Les 
bacteries ont ete comptees par dilutions serielles de la 
suspension d'origine sur milieu agar LB kanamycine et 
l'activite de la lucif erase exprimee en ULR//ig de proteines 
bacteriennes ou en ULR/103 bacteries. 

Construction de banques genomiques de M. tuberculosis 

Les banques ont ete obtenues en utilisant 
essentiellement pJVED a ,b,c precedemment decrit. 

Preparation de macrophages issus de la moelle osseuse et 
infection par M. smegmatis recombinants 

Les macrophages issus de la moelle osseuse ont ete 
prepares comme decrits par Lang, 1991. En resume, les cellules 
de la moelle osseuse ont ete preleves du femur de souris 
C57BL/6 agee de 6 a 12 semaines (If fa-Credo, France) . Les 
cellules en suspensions ont ete lavees et resuspendues dans du 
DMEM enrichi avec 10 % de serum foetal de veau, 10 % de milieu 
L-cell conditionne et 2 mM de glutamine, sans antibiotiques . 
106 cellules ont ete ensemencees sur des plaques 24 puits 
Costar a fond plat dans 1 ml. Apres quatre jours a 37°C dans 
une atmosphere humide a 10 % de teneur en C02, les macrophages 
ont ete rinces et reincubes pendant deux a quatre jours 
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supplementaires . Les cellules d'un puits controle ont ete 
lysees avec du triton x 100 a 0,1 % dans l'eau et les noyaux 
enumeres. Environ 5 x 10 5 cellules adherentes ont ete comptees. 
Pour 1' infection, Af. sniegmatis portant les differents plasmides 

5 a ete cultive en pleine phase exponentielle (DOsoOnm entre 0,4 
et 0,8) et dilue jusqu'a une DO de 0,1 puis 10 fois dans un 
milieu pour macrophage. 1 ml a ete ajoute a chaque puits et les 
plaques ont ete centrifugees et incubees quatre heures a 37°C. 
Apres trois lavages, les cellules ont ete incubees dans un 

10 milieu contenant de l'amykacine pendant deux heures. Apres 
trois nouveaux lavages, les cellules infectees adherentes ont 
ete incubees dans un milieu macrophage pendant une nuit. Les 
cellules ont ensuite ete lysees dans 0,5 ml de tampon de lyse 
(Promega) . 100 fil ont ete soniques et la lumiere emise a ete 

15 mesuree sur 25 /im. Simultanement , les bacteries ont ete 
enumerees par etalement sur L-agar-kanamycine (20 jig/ml - 1) . La 
lumiere emise est exprimee en ULR/103 bacteries. 



Analyses des banques de donnees 

20 

Les sequences nucleotidiques ont ete comparees a EMBL 
et GenBank en utilisant I'algorithme FASTA et les sequences 
proteiques ont ete analysees par similitude grace aux banques 
de donnees PIR et Swiss Prot en utilisant l'algorithme BLAST . 



Exemple 1 ; Les vecteurs pJVED 



Les vecteurs pJVED (Figure 1A) sont des 
30 plasmides portant un gene phoA tronque de E. coli depourvu de 

codon d ' initiation, de sequence signal et de sequence 
regulatrice. Le site multiple de clonage (SMC) permet 
1' insertion de fragments des genes codants pour d ! eventuelles 
proteines exportees ainsi que leurs sequences de regulation. 
35 Des lors, la proteine de fusion peut etre produite et presenter 
une activity phosphatase alcaline si elle est exportee. Seules 
les fusions en phase pourront etre productives. Ainsi, le SMC a 
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ete modifie de sorte que les fusions peuvent etre obtenues dans 
six phases de lecture. En aval de phoA, le gene luc de la 
lucif erase de luciole a ete insere. Le gene complet avec le 
codon d' initiation mais sans qu'aucun promoteur n'ait ete 
utilise devrait ainsi s'exprimer avec phoA comme dans un operon 
synthetique. Un nouveau site de liaison des ribosomes a ete 
insert huit nucleotides en amont du codon d r initiation de luc. 
Deux terminateurs transcriptionnels sont presents dans les 
vecteurs pJVED, un en amont du SMC et un second* en aval de luc. 
Ces vecteurs sont des plasmides de transfert E. coli- 

mycobacterium avec un gene de resistance a la kanamycine comme 
marqueur de selection. 

phoA et luc fonctionnent comme dans un operon, mais 
1' exportation est nScessaire pour 1'activite phoA. 

Quatre plasmides ont ete construits par insertion dans 
le SMC de fragments d'ADN d'origine diverse : 

Dans la premiere construction nommee pJVED/blaF, le 
fragment de 1,4 kb provient du plasmide deja decrit pLA71 (Lim, 
1995) . Ce fragment issu du gene (3-lactamase (JblaF) de M. 
fortuitum D216 (Timm, 1994) inclut le promoteur mute 
hyperactif, le segment codant pour 32 acides amines de la 
sequence signal et les 5 premiers acides amines de la proteine 
mature. Ainsi cette construction inclut le promoteur le plus 
fort connu chez mycobacterium et les elements necessaires a 
^exportation de la proteine de la fusion phoA. Par consequent, 
on peut attendre de cette construction une forte emission de 
lumiere et une bonne activite phoA. 

Dans une deuxieme construction nommee pJVED/hspl8, un 
fragment de 1,5 kb a ete clone a partir du plasmide deja decrit 
PPM1745 (Servant, 1995). Ce fragment inclut les nucleotides 
codants pour les dix premiers acides amines de la proteine de 
choc thermique de 18 kb issue de Streptomyces albus (heat shock 
protein 18, HSP 18), le site de liaison du ribosome, le 
promoteur et, en amont, des sites regulateurs controlant son 
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expression. Cette proteine appartient a la famille de alpha- 
crystalline de HSP a faible poids moleculaire (Verbon, 1992) . 
Son homologue issu de M. leprae, l'antigene de 18 kDa, est deja 
connu pour etre induit durant la phagocytose par un macrophage 
5 murin de la lignee cellulaire J-774 (Dellagostin, 1995) . Dans 
des conditions de culture standard, le pJVED/hsplS, montre une 
faible activite luc et aucune activite phoA. 

Dans une troisierae construction, nommee pJVED/ PI 9kDa, 
1 ■ insert issu de pExp410 (Lim # 1995) a ete coupe et clone dans 
10 le SMC de pJVED a . Ce fragment inclut les nucleotides codants 
pour les 134 premiers acides amines de la proteine connue de M. 

tuberculosis 19 kDa et de ses sequences regulatrices . Comme 

cela a pu etre mis en- — evidence, cette proteine est une 
lipoproteine glycosilee (Garbe, 1993 ; Herrmann, 1996) . Une 

15 partie de cette lipoproteine a ete fusionnee avec une proteine 
A de surface issue de Borrelia burgdorferi pour construire un 
vaccin recombinant de M. bovis BCG capable d'induire une forte 
reponse immunitaire (Stover, 1993) . Sur la figure 2, on 
observe, pour cette construction, une bonne activite luc 

20 correspondant a un promoteur fort, mais 1' activite phoA est, de 

loin, la plus forte des quatre constructions. L* activite phoA 

elevee de cette proteine de fusion avec une lipoproteine 
s'explique par le fait qu'elle reste attachee a la paroi 
cellulaire par son extremite N-terminal. 
25 Dans la quatrieme et derniere construction nommee 

pJVED/erp 1' insert provient de pExp53 (Lim, 1995) et a ete 

clone dans le SMC de pJVED a - pExp53 est le plasmide initial 
select ionne pour son activite phoA et contenant une partie du 

gene erp de M. tuberculosis qui code pour un antigene de 2 8 
30 kDa. Ce dernier inclut la sequence signal, une partie de la 
proteine mature et, en amont du codon d' initiation, le site de 
liaison de ribosome. Le promoteur a ete cartographie . Une boite 
fer (iron box) putative du type fur est presente dans cette 
region et encadre la region -35 du promoteur (Berthet, 1995). 
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Comme prevu (figure 2) cette construction presente une bonne 
emission lumineuse et une bonne activite phoA, Le fait que 
cette proteine de fusion, contrairement a la fusion avec la 
lipoproteine de 19 kDa, ne semble pas attachee a la paroi 
cellulaire n'exclut pas que la proteine native y soit associee. 
De plus, l'extremite C-terminal de erp est absente de la 
proteine de fusion. 

Exemple 2 : Construction d'une banque d'ADN genomique de M. 
tuberculosis dans les vecteurs pJVED s et identification d'un 
des membres de ces banques, (DP428), induit au cours de la 
phagocytose par les macrophages murins derives de la moelle 
osseuse. 

Les diffgrentes constructions sont testees pour leur 
capacite a evaluer 1' expression intracellulaire des genes 
identifies par l'expression de phoA. Dans cet objectif, 
l'activite luc est exprimee en URL pour 103 bacteries en 
culture axenique dans des conditions intracellulaires . 
L ! induction ou la repression suivant la phagocytose par les 
macrophages murins derives de la moelle osseuse peut etre 
evaluee convenablement par la mesure des activites specif iques. 
Les resultats de deux experiences distinctes sont presentes 
dans le tableau 2. 

Le plasmide pJVED/hsplS a ete utilise comme controle 
positif pour 1» induction durant la phase de croissance 
intracellulaire. Malgre que l 1 induction du prometteur par le 
chauffage de la bacterie a 42°C n»ait pas ete concluant la 
phagocytose de la bacterie conduit clairement a une 
augmentation de l 1 activite du promoteur. Dans toutes les 
experiences, l 1 activite luc intracellulaire a ete fortement 
induite, augmentant de 20 a 100 fois 1' activite basale 
initialement faible (Servant, 1995) . 

Le plasmide pJVED/blaF a ete utilise comme controle de 
la modulation non specif ique au cours de la phagocytose. De 
faibles variations ont pu etre mises en evidence, probablement 
dues a des changements de conditions de cultures. Quoi qu'il en 
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soit, ces faibles variations ne sont pas comparables a 
1' induction observee avec le plasmide pJVED/ hspl8 . 

Tous les membres de la banque d'ADN ont ete testes par 
mesure de 1' activity du promoteur durant la croissance 
5 intracellulaire. Parmi eux, le DP428 est fortement induit au 
cours de la phagocytose (tableau 1) . 
TABLEAU 1 (cf . apres les exemples) . 

Exemple 3 : La sequence complete du g£ne DP428 et de ses 
10 regions f lanquantes . 

Une sonde de la region codante de DP428 a ete obtenue 
par ACP, et utilisee pour hybrider I'ADN genomique de 
differentes especes de mycobact6ries . D 1 apres les resultats de 
15 la figure 3, le gene est present uniquement dans les 
mycobacteries du complexe de M. tuberculosis . 

L 1 analyse de la sequence montre que DP428 fait partie 
d'un operon. La sequence codante et les regions f lanquantes ne 
presentent aucune hotnologie avec des sequences connues deposees 

20 dans les banques de donnees. 

D* apres la sequence codante, ce gene code pour une 
proteine de 10 kDa avec un peptide signal, une extremite C- 
terminal hydrophobe terminee par deux arginines et precedee par 
un motif LPISG semblable au motif connu LPXTG. Ces deux 

25 arginines pourraient correspondre a un signal de retention et 
la proteine DP428 pourrait etre accrochee par ce motif a des 
peptidoglycanes comme cela a deja ete decrit chez d'autres 
bacteries Gram+ . 

Le mecanisme de survie et de croissance intracellulaire 

30 des mycobacteries est complexe et les relations intimes entre 
la bacterie et la cellule hote restent inexpliquees . Quel que 
soit le mecanisme, la croissance et la survie intracellulaire 
des mycrobacteries depend de facteurs produits par la bacterie 
et capables de moduler la reponse de l'hote. Ces facteurs 

35 peuvent etre des molecules exposees a la surface cellulaire 
telle que LAM ou des proteines associees a la surface 
cellulaire, ou des molecules activement secretees. 
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D'un autre cote, intracellulairement , les bacteries 
elles-memes doivent faire face a un environnement hostile. 
Elles semblent y repondre par des moyens proches de ceux mis en 
oeuvre dans les conditions de stress, par 1' induction de 
5 proteines de choc thermique (Dellagostin, 1995) , mais aussi par 
induction ou la repression de diff^rentes proteines (Lee, 
1995) . En utilisant une methodologie derivee de la PCR, Plum et 
Clark-curtiss (Plum, 1994) ont montre qu f un gene de M. avium 

inclu dans un fragment d'ADN de 3 kb, est induit apres la 
10 phagocytose par des macrophages humains. Ce gene code pour une 
proteine putative exportee comprenant une sequence leader mais 
ne presentant pas d'homologie significative avec les sequences 
proposees par les banques de donnees. L' induction, pendant la 
phase de croissance intracellulaire, d'une proteine de choc 
15 thermique de faible poids moleculaire issue de M. leprae a 

egalement ete mise en evidence (Dellagostin, 1995) . Dans une 
autre etude, les proteines bacteriennes de M. tuberculosis ont 

ete metaboliquement marquees pendant la phase de croissance 
intracellulaire ou bien dans des conditions de stress et 
20 separees par electrophorese sur gel a deux dimensions : 16 
proteines de M. tuberculosis ont ete induites et 28 reprimees. 

Les memes proteines sont mises en jeu au cours de stress 
provoque par un faible pH, un choc thermique, H2O2, ou au cours 
de la phagocytose par des monocytes humains de la lignee THP1 . 

25 Quoi qu'il en soit, le comportement des proteines induites et 
reprimees etait unique dans chaque condition (Lee, 1995) . Pris 
ensemble, ces resultats indiquent qu'un dialogue moleculaire 
subtile est mis en place entre les bacteries et leurs hotes 
cellulaires. De ce dialogue depend probablement le sort de 

30 ^organisme intracellulaire. 

Dans ce contexte, 1 1 induction de 1' expression de DP428 
pourrait etre d'une importance majeure, indiquant un role 
important de cette proteine dans la survie et la croissance 
intracellulaire. 

35 



La methode utilisee dans ces experiences pour evaluer 
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1' expression intracellulaire des genes pr6sente l'avantage 
d'etre simple comparee aux autres techniques comme la technique 
decrite par Mahan et al. (Mahan, 1993) adaptee aux 
mycobacteries et proposee par Bange et al* (Bange, 1996), ou la 
5 methode substractive basee sur 1 ! ACP decrite par Plum et Clark - 
curtiss (Plum, 1994) . II existe indiscutablement une 
variability comme le montre la comparaison des differentes 
experiences, Bien que provoquer 1* induction ou la repression 
soit suffisant il est desormais possible de l'evaluer 
10 fournissant ainsi un outil supplementaire d' etudes 
physiologiques des proteines exportees identifiees par fusion 
avec phoA. 

Exemple 4 : 

15 Recherche d'une modulation de I'activite des promoteurs lors 
des phases intramacrophagiques 

Des macrophages de moelle osseuses de souris sont prepares 
comme decrit par Lang et Antoine(Ref. 13). Les bacteries de Af. 

20 segmentis recombinantes, dont on a determine I'activite 
lucif erase par 10 3 bacteries comme precedemment, sont incubees 
a 37°C sous atmosphere humidifiee et enrichie en C0 2 a 5%, 
pendant 4 heures en presence de ces macrophages de telle 
maniere qu'elles soient phagocytees, Apres ringage pour 

25 eliminer les bacteries extracellulaires restantes, on ajoute au 
milieu de culture de l ! amikacine (100 fig/ml) pendant deux 
heures. Apres un nouveau ringage, le milieu est remplac£ par un 
milieu de culture (DMEM enrichi de 10% de s£rum de veau et 2mM 
de glutamine) sans antibiotiques . Apres une nuit d' incubation 

30 comme precedemment, les macrophages sont lyses a froid (4°C) a 
l'aide d'un tampon de lyse (cell lysis buffer, Promega) , et 
I'activite lucif erase par 10 3 bacteries determin6e. Le rapport 
des activites a la mise en culture et apres une nuit donne le 
coefficient d' induction. 
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Revendications 

1. Vecteur recombinant de criblage, de clonage et/ou 
d' expression, caracterise en ce qu'il se replique chez des 

5 mycobacteries et en ce qu'il contient : 

1) un replicon fonctionnel chez les mycobacteries ; 

2) un marqueur de selection ; 

3) une cassette reporteur comprenant : 

a) un site de clonage multiple (polylinker) , 
10 b) eventuellement un terminateur de transcription actif 

chez les mycobacteries, en amont du polylinker, 

c) une sequence nucleotidique codante issue d'un gene 
codant pour un marqueur d* expression, d 1 exportation et/ou de 
secretion de proteine, ladite sequence nucleotidique etant 

15 depourvue de son codon d' initiation et de ses sequences de 
regulation, et 

d) une sequence nucleotidique codante issue d'un gene 
codant pour un marqueur d'activite de promoteurs contenus dans 
l e meme fragment, ladite sequence nucleotidique etant pourvue 

20 de son codon d 1 initiation . 

2. Vecteur recombinant selon la revendication 1, caracterise en 
ce que la sequence nucleotidique codante issue d'un gene codant 
pour un marqueur d ' expression, d 1 exportation et/ou de secretion 

25 de proteine est une sequence codante issue du gene phoA de la 
phosphatase alcaline . 

3. Vecteur recombinant selon l'une des revendications 1 et 2, 
caracterise en ce que la sequence nucleotidique codante issue 

30 d'un gene codant pour un marqueur d 1 expression, d 1 exportation 
et/ou de secretion de proteine est une sequence codante du gene 
de la (i-agarase, de la nuclease d'un staphylocoque ou de la P- 
lactamase d'une mycobacterie . 

35 4. Vecteur recombinant selon I'une des revendications 1 a 3, 
caracterise en ce que la sequence nucleotidique codante issue 
d'un gene codant pour un marqueur d'activite de promoteurs 
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contenus dans le meme fragment est une sequence codante issue 
du gene luc de la lucif erase de luciole. 

5. Vecteur recombinant selon l'une des revendications 1 a 4, 
5 caracterise en ce que la sequence nucleot idique codante issue 
d'un gene codant pour un marqueur d'activite de promoteurs 
contenus dans le meme fragment est une sequence codante issue 
du gene GFP de la Green Fluorescent Protein. 

10 6. Vecteur recombinant selon l'une des revendications 1 a 5, 
caracterisS en ce que le terminateur de transcription actif 
chez les mycobacteries est le terminateur du coliphage T4 
(tT4) . 

15 7. Vecteur recombinant selon l'une des revendications 1 a 6, 
caracterise en ce qu'il est un plasmide choisi parmi les 
plasmides suivants deposes a la CNCM (Collection Nationale de 
Cultures de Microorganismes, Paris, France) : 

a) pJEVDa depose a la CNCM sous le N° 1-1797, le 12/12 

20 1996, 

b) pJEVDb depose a la CNCM sous le N° 1-1906, le 25 
juillet 1997, 

c) pJEVDc depose a la CNCM sous le N° 1-1799, le 12/12 

1996, 

25 d) pJEVD/M. tuberculosis depose a la CNCM sous le N° I- 

1907, le 25 juillet 1997. 

8. Vecteur recombinant selon l'une des revendications 1 a 7, 
caracterise en ce qu'il comprend en l'un des sites de clonage 

30 du polylinker une sequence d'acide nucleique de mycobacterie 
chez laquelle on detecte un polypeptide susceptible d'etre 
exporte et/ou secrete, et/ou d'etre induit ou reprime lors de 
1' infection par ladite mycobacterie ou encore produit de fagon 
constitutive, ainsi que les sequences promotrices et/ou 

35 regulatrices associees susceptibles de permettre ou de 
favoriser 1 ' exportation et/ou la secretion dudit polypeptide, 
ou tout ou partie de gene codant pour ledit polypeptide. 
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9. Vecteur recombinant selon l'une des revendications 1 a 8, 
caracterise en ce que la sequence d'acide nucleique de 
mycobacterie qu'il contient est obtenue par digestion 
enzymatique de 1 1 ADN genomique ou de I'ADN complementaire d'un 

5 ARN d'une mycobacterie pathogene. 

10. Vecteur recombinant selon l'une des revendications 1 a 9, 
caracterise en ce que ladite mycobacterie pathogene est AT. 

tuberculosis . 

10 

11 . Vecteur recombinant selon 1 ' une des revendications 1 a 9 , 
caracterise en ce que ladite mycobacterie pathogene est 
choisie parmi M. africanum, M. bovis, M. avium ou M. leprae 

15 12. Vecteur recombinant selon la revendications 10, 
caracterise en ce qu'il est un plasmide choisi parmi les 
plasmides suivants deposes a la CNCM: 

a) p6D7 depose le 28 janvier 1997 a la CNCM sous le N°I-1814, 

b) p5A3 depose le 28 janvier 1997 a la CNCM sous le N°I-1815 / 
20 c)p5F6 depose le 28 janvier 1997 a la CNCM sous le N°I-1816, 

d) p2A29 depose le 28 janvier 1997 a la CNCM sous le N°I-1817, 

e) pDP428 depose le 28 janvier 1997 a la CNCM sous le N°I-1818, 

f) p5B5 depose le 28 janvier 1997 a la CNCM sous le N°I-1819, 

g) plC7 depose le 28 janvier 1997 a la CNCM sous le N°I-1820, 
25 h)p2D7 depose le 28 janvier 1997 a la CNCM sous le N°I-1821, 

i)plB7 depose le 31 janvier 1997 a la CNCM sous le N°I-1843. 

13. Vecteur recombinant selon la revendication 12, caracterise 
en ce qu'il s'agit du plasmide pDP428 depose le 28 janvier 1997 

30 a la CNCM sous le N°I-1818. 

14. Procede de criblage de sequences de nucleotides issues de 
mycobacteries pour determiner la presence de sequences 
correspondant a des polypeptides exportes et/ou secretes 

35 pouvant etre induits ou reprimes lors de I 1 infection, leurs 
sequences promotrices et/ou regulat rices associees 

susceptibles notamment de permettre ou de favoriser 
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1 'exportation et/ou la secretion desdits polypeptides 
d'interet, ou tout ou partie de genes d'interet codant pour 
lesdits polypeptides, caracterise en ce qu'il met en oeuvre un 
vecteurselon l ! une des revendications 1 a 13 . 

5 

15. Procede de criblage selon la revendication 14, caracterise 
en ce qu'il comprend les etapes suivantes : 

a) la digestion des sequences d'ADN de mycobacteries par 

au moins une enzyme determinee et la recuperation des fragnents 
10 de digestion obtenus ; 

b) 1' insertion des fragments de digestion dans un site de 
clonage compatible avec 1' enzyme de l'etape a) du polylinker 
d'un vecteur selon l'une des revendications 1 a 13 ; 

c) si besoin, 1 ' amplification du fragment de digestion 
15 contenu dans le vecteur, par exemple par replication de ce 

dernier apres insertion du vecteur ainsi modifie dans une 
cellule determinee, de preference E coli ; 

d) la transformation de cellules hotes par le vecteur 
amplifie a l'etape c) , ou en l'absence d ' amplification, par le 

20 vecteur de l'etape b) ; 

e) la culture de cellules hotes transformees dans un 
milieu permettant la mise en evidence du marqueur d' exportation 
et/ou de secretion, et /ou du marqueur d'activite de promoteurs 
contenu dans le vecteur ; 

25 f) la detection des cellules hotes positives (colonies 

positives) pour l'expression du marqueur d 1 exportation et/ou de 
secretion, et /ou du marqueur d'activite de promoteurs ; 

g) l'isolement de I'ADN des colonies positives et 
l 1 insertion de cet ADN dans une cellule identique a celle de 

30 l'etape c) ; 

h) la selection des insertions contenues dans le vecteur, 
permettant l'obtention de clones positifs pour le marqueur 
d 1 exportation et/ou de secretion, et /ou pour le marqueur 
d'activite de promoteurs ; 

35 i) 1 ' isolement et la caracterisation des fragments d'ADN de 

mycobacteries contenues dans ces inserats, et l'etape i) du 
procede pouvant comporter en outre une etape de sequengage des 
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insertions selectionnees . 



16. Banque d 1 ADN genomique ou d'ADNc complement a ire d'ARNm de 
mycobacterie, caracterisee en ce qu'elle est obtenue par un 
5 procede selon la revendication 14 et/ou un procede comprenant 
les etapes a) et b) , ou a) , b) et c) du procede selon la 
revendication 15 . 



17. Banque d'ADN genomique ou d'ADNc complementaire d'ARNm de 
10 mycobacterie selon la revendication 16, caracterisee en ce que 

ladite mycobacterie est une mycobacterie pathogene. 

18. Banque d 1 ADN genomique ou d'ADNc complementaire d'ARNm de 
mycobacterie selon la revendication 17, caracterisee en ce que 

15 ladite mycobacterie est une mycobacterie appartenant au groupe 
du complexe Mycobacterium tuberculosis . 



19. Banque d'ADN genomique ou d'ADNc complementaire d'ARNm de 
mycobacterie selon la revendication 18, caracterisee en ce que 
20 ladite mycobacterie est Mycobacterium tuberculosis . 



20. Sequence nucleotidique de mycobacterie susceptible d'etre 
selectionnee par un procede selon I'une des revendications 14 
et 15. 

25 

21. Sequence nucleotidique de mycobacterie selon la 
revendication 20 caracterisee en ce qu'elle est choisie 
parmi les sequences de fragments d'ADN de mycobacteries de 
sequence SEQ ID N°3, SEQ ID N°4, SEQ ID N°5, SEQ ID N°6, SEQ ID 

30 N°7, SEQ ID N°8, SEQ ID N°9 ou SEQ ID N°10, contenus 
respect ivement dans les vecteurs p6D7 (CNCM, N°I-1814) , p5A3 
(CNCM, N°I-1815) ,p5F6 (CNCM, N°I-1816) , p2A29 (CNCM, N°I-1817), 
p5B5 (CNCM, N°I-1819) ,plC7 (CNCM, N°I-1820), p2D7 (CNCM,N°I- 
1821) et plB7 (CNCM sous le N°I-1843) . 
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22 . Sequence nucleotidique de mycobacterie selon la 
revendication 20 caracterisee en ce qu'elle est choisie 
parmi les sequences de fragments d'ADN de mycobacteries de 
sequence nucleiques SEQ ID N°ll et SEQ ID N°24. 

5 

23. Polypeptide susceptibles d'etre codes par une sequence 
nucleotidique de mycobacterie selon l'une des revendications 20 
a 22. 

10 24. Mycobacterie recombinantes caracterisee en ce qu'elle est 
transformee par un vecteur recombinant selon l'une des 
revendications 1 a 13 . 

25. Polynucleotide de sequence SEQ ID N°l ou SEQ ID N°2. 

15 

26. Polynucleotide caracterise en ce qu'il comprend un 
polynucleotide choisi parmi : 

a) un polynucleotide de sequence SEQ ID N°l ou SEQ ID N°2, 

b) un polynucleotide dont la sequence est complementaire de la 
20 sequence du polynucleotide defini en a) , 

c) un polynucleotide dont la sequence comporte au moins 80% 
d'homologie avec un polynucleotide defini en a) ou b) , 

d) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide defini en a) , b) 

25 ou c) , 

e) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide defini en a) , b) , c) ou d) . 

27. Polynucleotide selon l'une des revendications 25 et 26, 
30 caracterise en ce que sa sequence nucl^ique est specifique de 

sequence de mycobacteries appartenant au complexe de 
Mycobacterium tuberculosis . 

28. Polypeptide de sequence d'acides amines SEQ ID N°l ou SEQ 
35 ID N°2. 
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29. Polypeptide caracterise en ce qu'il comprend un polypeptide 
choisi parmi : 

a) un polypeptide de sequence d'acides amines SEQ ID N°l ou SEQ 
ID N°2, 

5 b) un polypeptide horaologue au polypeptide def ini en a) , 

c) un fragment d'au moins 5 acides amines d'un polypeptide 
def ini en a)ou b) , 

d) un fragment biologiquement actif d'un polypeptide def ini en 
a) , b) , ou c) . 

10 

30. Polynucleotide caracterise en ce qu ! il code pour un 
polypeptide selon l'un des revendications 28 et 29. 

31. Sequence d'acide nucleique utilisable comme amorce, 
15 caracterisee en ce que ladite sequence est choisie parmi les 

sequences d'acide nucleique de polynucleotide selon l'une des 
revendications 25 a 27, et 30. 

32. Sequence d'acide nucleique selon la revendication 31, 
20 caracterisee en ce que ladite sequence est choisie parmi les 

sequences suivantes : SEQ ID N°25 et SEQ ID N°26. 

33. Sequence d'acide nucleique selon 1 1 une des revendications 
31 et 32 pour la detection et/ou 1 ' amplification de sequences 

25 nucleiques. 

34. Sequence d'acide nucleique utilisable comme sonde, 
caracterisee en ce que ladite sequence est choisie parmi les 
sequences d'acide nucleique selon l'une des revendications 25 a 

30 27, et 30. 

35. Sequence d'acide nucleique selon la revendication 34 , 
caracterisee en ce qu' elle est marquee par un compose 
radioactif ou par un compose non radioactif . 

35 
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36. Sequence d'acide nucleique selon l f une des revendications 
34 et 35, caracterisee en ce que celle-ci est immobilisee sur 
un support, de maniere covalente ou non-covalente . 

5 37. Sequence d'acide nucleique selon l'une des revendications 
34 a 36 pour la detection et/ou 1 1 amplification de sequences 
nucl£iques . 

38. Sequence d'acide nucleique selon l'une des revendications 
10 34 a 37, caracterisee en ce que ladite sequence est choisie 

parmi les sequences suivantes : du nucleotide 924 au nucleotide 
1234 inclus dans SEQ ID N°l. 

39. Vecteur recombinant de clonage, d' expression et/ou 
15 d' insertion , caracterise en ce qu'il contient une sequence 

d'acide nucleique de polynucleotide selon l'une des 
revendications 25 a 27, et 30. 

40. Vecteur recombinant selon la revendication 39, caracterise 
20 en ce qu'il s'agit du plasmide pDP428 depose le 28 janvier 1997 

a la CNCM sous le N°I-1818. 

41. Cellule hote, caracterisee en ce qu'elle est transformee 
par un vecteur recombinant selon 1 1 une des revendications 39 et 

25 40. 

42. Cellule hote selon la revendication 41, caracterisee en ce 
qu'elle s'agit de la souche de E. coli transformee par le 
plasmide pDP428 depose le 28 janvier 1997 a la CNCM sous le 

30 N°I-1818 . 

43. Polypeptide recombinant, caracterise en ce qu'il est obtenu 
a partir d'une cellule hote recombinant selon l'une des 
revendications 41 et 42. 

35 



75 



2767336 



44. Polypeptide hybride, caracterise en ce qu'il comporte au 
moins la sequence d'un polypeptide selon l f une des 
revendications 28, 29 et 43 et une sequence d'un polypeptide 
susceptible d'induire une reponse immunitaire chez 1 1 homme ou 

5 1 1 animal . 

45. Polypeptide hybride selon la revendicat ion 44, caracterise 
en ce que le polypeptide susceptible d'induire une reponse 
immunitaire contient au moins un determinant antigenique 

10 capable d'induire une reponse humorale et/ou cellulaire. 

46. Polypeptide hybride selon I 1 une des revendications 44 et 
45, caracterise en ce que le determinant antigenique correspond 
a un determinant antigenique de proteines immunogenes 

15 selectionnees par exemple parmi ESAT6 et DES de 45/47 kD de 
Mycoba c t er i um t uberc ulosis. 

47. Polypeptide hybride selon l'une des revendications 44 et 
45, caracterise en ce que le determinant antigenique correspond 

20 a un determinant antigenique de l'antigene de surface ou 
d'enveloppe d'un virus de 1' hepatite ou de l'antigene VP1 du 
virus de la poliomyelite . 

48. Polypeptide hybride selon l'une des revendications 44 et 
25 45, caracterise en ce que le determinant antigenique est 

const itue de tout ou partie d'une proteine selectionnee parmi 
les proteines gag, pol, nef ou env de HIV-1 ou HIV- 2. 

49. Polynucleotide codant pour un polypeptide hybride selon 
l'une des revendications 44 a 48. 

30 

50. Polypeptide hybride selon l'une des revendications 44 a 48 
caracterisee en ce qu'il s*agit d'une proteine recombinante 
obtenue par l 1 expression d'un polynucleotide selon la 
revendication 49. 

35 

51. Proced£ pour la detection in vitro d'anticorps diriges 
contre une bacterie du complexe Mycobacterium tuberculosis dans 
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un echantillon biologique, caracterise en ce qu'il comprend les 
etapes suivantes : 

a) Mise en contact de 1 1 echantillon biologique avec un 
polypeptide selon l'une des revendications 28, 29 et 43; 

5 b) Mise en evidence du complexe antigene-anticorps forme. 

52. Kit pour le diagnostic in vitro d'une infection par une 
mycobacterie appartenant au complexe Mycobacterium 

tuberculosis , comprenant : 

10 a) un polypeptide selon l'une des revendications 28, 29 

et 43; 

b) les reactifs pour la constitution du milieu propice S 
la reaction immunologique ; 

c) les reactifs permettant la detection des complexes 
15 antigene-anticorps produits par la reaction immunologique ; 

d) le cas echeant, un echantillon biologique de reference 
(temoin negatif) depourvu d'anticorps reconnus par ledit 
polypeptide ; 

e) le cas echeant, un echantillon biologique de 
20 reference (temoin posit if) contenant une quantite predeterminee 

d'anticorps reconnus par ledit polypeptide. 

53. Anticorps mono- ou polyclonaux, leurs fragments, ou 
anticorps chimeriques, caracterises en ce qu f ils sont capables 

25 de reconnaitre specif iquement un polypeptide selon l'une des 
revendications 28, 29 et 43. 

54. Anticorps selon la revendication 53, caracterise en ce 
qu'il s'agit d'un anticorps marque. 

30 

55. ProcedS pour la detection specif ique de la presence d'un 
antigene d'une bacterie du complexe Mycobacterium tuberculosis 

dans un echantillon biologique, caracterise en ce qu'il 
comprend les etapes suivantes : 
35 a) Mise en contact de 1 1 echantillon biologique avec un 

anticorps selon l'une des revendications 53 et 54; 

b) Mise en Evidence du complexe antigene-anticorps forme. 
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56. Kit pour la detection specif ique de la presence d'un 
antigene d'une bacterie du complexe Mycobacterium tuberculosis 

dans un echantillon biologique, caracterise en ce qu f il 
comprend les elements suivants : 
5 a) Un anticorps polyclonal ou monoclonal selon 1 ' une des 

revendications 53 et 54; 

b) les reactifs pour la constitution du milieu propice a 
la reaction immunologique ; 

c) les reactifs permettant la detection des complexes 
10 antigene-anticorps produits par la reaction immunologique. 

57. Procede de detection et d' identification rapide de M* 

tuberculosis dans un echantillon biologique, caracterise en 

ce qu'il comporte les etapes suivantes : 
15 a) Isolement de 1 1 ADN a partir de 1 1 echantillon biologique 

a analyser, ou obtention d'un ADNc a partir de 1 1 ARN de 
1 1 echantillon biologique ,- 

b) Amplification specif ique de 1 1 ADN des mycobacteries 
appartenant au complexe Mycobacterium tuberculosis a l'aide 

20 d' amorces selon l'une des revendications 31 a 33; 

c) Analyse des produits d 1 amplification. 

58. Procede pour la detection specif ique de bacteries 
appartenant au complexe Mycobacterium tuberculosis dans un 

25 echantillon biologique, caracterise en ce qu'il comprend les 
etapes suivantes : 

a) Mise en contact d'une sonde oligonucleotidique selon 
l'une des revendications 34 a 38 avec un echantillon 
biologique, 1 'ADN contenu dans 1 1 echantillon biologique ayant , 

30 le cas echeant, prealablement ete rendu accessible a 
1 ' hybridation, dans des conditions permettant 1 ' hybridation de 
la sonde a 1 1 ADN d'une bacterie du complexe Mycobacterium 

tuberculosis ; 

b) Detection de l'hybride forme entre la sonde 
35 oligonucleotidique et l'ADN de 1 1 echantillon biologique. 
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59. Procede pour la detection specif ique de bacteries 
appartenant au complexe Mycobacterium tuberculosis dans un 
echantillon biologique, caracterise en ce qu'il comprend les 
etapes suivantes : 

5 a) Mise en contact d'une sonde oligonucleotidique 

immobilisee sur un support selon la revendication 36 avec un 
echantillon biologique, l'ADN de 1 1 echantillon, ayant, le cas 
echeant, ete prealablement rendu accessible a 1 1 hybridation, 
dans des conditions permettant 1 ' hybridation de la sonde a 

10 l'ADN d'une bacterie du complexe Mycobacterium tuberculosis; 

b) Mise en contact de l'hybride forme entre la sonde 
oligonucleotidique immobilisee sur un support et l'ADN contenu 
dans 1 ' echantillon biologique, le cas echeant apres 
elimination de l'ADN de 1 ' echantillon biologique n 1 ayant pas 

15 hybride avec la sonde, avec une sonde oligonucleotidique 
marquee selon la revendication 35. 

60. Procede de detection selon la revendication 59, caracterise 
en ce que, prealablement a 1 1 etape a), l'ADN de 1 1 echantillon 

20 biologique, ou l'ADNc obtenu par transcription inverse de l'ARN 
de 1 •echantillon, est amplifie a l'aide d'un couple d' amorces 
selon l'une des revendications 31 a 33. 

61. Procede pour la detection specif ique de la presence d'une 
25 bacterie appartenant au complexe de Mycobacterium tuberculosis 

dans un echantillon biologique, caracterise en ce qu'il 
comprend les etapes suivantes : 

a) Mise en contact de 1 1 echantillon biologique avec un 
couple d' amorces selon l'une des revendications 31 a 33, l'ADN 

30 contenu dans 1 ' echantillon ayant ete, le cas echeant, 
prealablement rendu accessible a 1 ' hybridation, dans des 
conditions permettant une hybridation des amorces a l'ADN d'une 
bacterie du complexe Mycobacterium tuberculosis; * 

b) amplification de l'ADN de la bacterie du complexe 
35 Mycobacterium tuberculosis; 



79 



2767336 



c) mise en Evidence de 1 1 amplification de fragments d'ADN 
correspondant au fragment encadre par les amorces, par exemple 
par 61ectrophorese sur gel ou au moyen d'une sonde 
oligonucleotidique marquee selon la revendication 35. 

5 

62. Procede pour la detection specif ique de la presence d'une 
bacterie appartenant au complexe de Mycobacterium tuJberculosis 
dans un echantillon biologique, caracterise en ce qu'il 
comprend les etapes suivantes : 

10 a) Mise en contact de 1 1 echantillon biologique avec deux 

couples d' amorces selon l'une des revendications 31 a 33, 
l'ADN contenu dans 1 'echantillon ayant ete, le cas echeant, 
prealablement rendu accessible a 1 • hybridation, dans des 
conditions permettant une hybridation des amorces a l'ADN 

15 d'une bacterie du complexe Mycobacterium tuberculosis; 

b) amplification de l'ADN de la bacterie du complexe 
Mycobacterium tuberculosis; 

c) mise en evidence de 1 ' amplification de fragments d 1 ADN 
correspondant au fragment encadre par lesdites amorces, par 

20 exemple par electrophorese sur gel ou au moyen d'une sonde 
oligonucleotidique marquee selon la revendication 35. 

63. Kit pour la detection de la presence d'une bacterie du 
complexe Mycobacterium tuberculosis dans un echantillon 

25 biologique, caracterise en ce qu'il comprend les elements 
suivants : 

a) Une sonde oligonucleotidique selon l'une des 
revendications 34 a 38; 

b) Les reactifs necessaires a la mise en oeuvre d'une 
30 reaction d 1 hybridation ; 

c) Le cas echeant, un couple d' amorces selon l'une des 
revendications 31 a 33 ainsi que les reactifs necessaires a 
une reaction d 1 amplification de l'ADN (ADN genomique, 
plasmidique ou ADNc) d'une bacterie du complexe Mycobacterium 

35 tuberculosis . 
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64. Kit ou necessaire pour la detection de la presence d'une 
bacterie du complexe Mycobacterium tuberculosis dans un 
echantillon biologique, caracterise en ce qu'il comprend les 
elements suivants : 

5 a) Une sonde oligonucleotidique, dite sonde de capture, 

selon la revendication 36; 

b) Une sonde oligonucleotidique, dite sonde de revelation, 
selon l'une des revendications 34 a 38. 

c) Le cas echeant, un couple d' amorces selon I 1 une des 
10 revendications 31 a 33 ainsi que les reactifs necessaires a 

une reaction d' amplification de l'ADN d'une bacterie du 
complexe Mycobacterium tuberculosis. 

65. Kit pour 1 1 amplification de l'ADN d'une bacterie du 
15 complexe Mycobacterium tuberculosis present dans un echantillon 

biologique, caracterise en ce qu'il comprend les elements 
suivants : 

a) Un couple de fragments d'acide nucleique selon l'une 
des revendications 31 a 33; 
20 b) Les reactifs necessaires pour effectuer une reaction 

d' amplification d'ADN; 

c) Eventuellement un composant permettant de verifier la 
sequence du fragment amplifie, plus part iculierement une sonde 
oligonucleotidique selon l'une des revendications 34 a 38. 

25 

66. Composition immunogene caracterisee en ce qu'elle comprend 
un ou plusieurs polypeptides selon l'une des revendications 28, 
29 et 43 et/ou un ou plusieurs polypeptides hybrides selon 
l'une des revendications 44 a 50. 

30 

67. Vaccin caracterise en ce qu'il contient un ou plusieurs 
polypeptides selon l'une des revendications 28, 29 et 43 et/ou 
un ou plusieurs polypeptides hybrides selon l'une des 
revendications 44 a 50, en association avec un vehicule 

35 pharmaceutiquement compatible et, le cas echeant un adjuvant de 
1 ' immunite approprie . 
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68. Vaccin destine a 1 1 immunisation a l'encontre d'une 
infection bacterienne ou virale, telle que la tuberculose ou 
1 'hepatite, comprenant un vecteur selon la revendication 39 ou 
un polynucleotide selon la revendication 49, en association 
avec un vehicule pharmaceutiquement compatible. 
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CGCTCTGGGGCTCMAfA^CTGCAG {^GGAG^ AGATCCAAATG 



Pst\ 



FIGURE 1 



2/73 



2767336 




3/73 



2767336 



1 2 3 4 5 6 7 8 9 10111213 




1: M. tuberculosis 2: M. bovis 3: BCG 4: M. africanum 5: cancelled 6: M. 
fortuitum 7: M. simiae 8: M. avium 9: M. chelonae 10: M. flavescens 11: 
M. gordonae 12: M. marinum 13: M. kansasii 



FIGURE 3 
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ins.428def-strider -> Genes 

um. sequence 1243 b.p. GGATCCCAGGGA ... CGCATCGGMCC linear 



1 

1 


GGATCOCAGGGAACGTGACC ATG GTC GTA GGG ATG ACT TGA CAGTTTCAACGGGCTroCGACX^CCGTrGC^ 
M V V G M T * 


72 
7 


73 
1 


TCAGAAGGCATACX5TTGGTO3AACACGTCGG ATG GCT GGC GAC CAA GAG CTG 

M A G D Q E L 


144 

7 


145 

8 


GM 

E 


CTG 
L 


CGG 
K 


TTC 
F 


GAC 
D 


GTT CCT 
V p 


CTT 
L 


TAC 
Y 


ACG 
T 


CTT 

L 


GCC GAG GCA TCG CGG TAC CTG GTG GTT 
AEASRTLVV. 


204 

27 


205 
28 


ccc 
p 


CGC 
R 


GCG 
A 


ACC 
X 


CTG 
L 


GCT ACG 
A T 


TGG 
W 


GCT 
A 


GAC 
D 


GGC 
G 


TAC GAG CGT CGG CCG GCC AAC GCA CCG 
YERRPANA P 


264 
47 


265 
48 


GCG 
A 


GTC 
V 


CAG 
Q 


GGG 
G 


CAA 
Q 


CCG ATC 
P I 


GCC 
A 


TTT 
F 


GAC 
D 


GCC 
A 


TAT TCG GTC GCG CAG CTT TTT GGC GAC 
T5VAQLFGD 


67 


325 
68 


CTC 
V 


ACT 
T 


GGT 
G 


GCC 
A 


CGC 
R 


GTT GCG 
V A 


GGC 
G 


GTC 
V 


CAG 
Q 


CCG 
P 


CAG CGA CAC CAC ATA CGG CCG GTC CGG 
QRHHIRPVR 


384 
87 


385 
88 


TTG 
L 


CGG 
R 


GGG 
G 


CCG 
P 


TTG 
L 


GGT GGG 
G G 


GTT 
V 


GGG 
G 


TGC 
C 


CTC 
h 


CGT CAC CCC AGG CAG TTC GCT GGC TAT 
RHPRQFAGY 


444 

107 


44S 
108 


TTG 
L 


TOG 
S 


CAG 
Q 


TAG 
* 


CGCGACGGCATTGTCG ATG TCT TGG TAG CTAGCATCCGGTCGGGGGGCCGCTACCAGCG 
M S H * 


515 
4 


516 
1 










rrCGTGGACCAGCA ATG ACT GCG ACC CGG 
M T AT R 


587 

5 


588 
6 


CGA 
R 


CTT 
L 


CGA 
K 


AAC 
H 


CGC 
R 


CAC CGG 
H R 


TTA 
L 


GAT 
D 


TCC CCG ACT GCG TCA TCG CCA GGT AAA CCG CCG 
SPTASSPGKPP 


647 
25 


648 
26 


GCA 
A 


CTA 
L 


ACG 
T 


CCA 
P 


GCA 
A 


ACC AAC 
T N 


CCG 
P 


TGA 


AGACOIACCAACGGCACCTGCG^ 


718 
34 


719 
1 


ATG 
M 


AAC 
N 


TGC 
C 


TGG 
W 


ATT 

I 


TCG GAC 
S D 


TCC 
S 


CCG 
P 


TAC 
Y 


TCT 

S 


CGC GCA GTG CGT GCC CGC GAG CCT ACC 
RAVRAREPT 


778 
20 


779 
21 


GAA 
E 


GAT 
D 


CGC 
R 


GTG 
V 


CAT 
H 


GCG TTC 
A F 


GGC 
G 


GTG 
V 


GAC 
D 


CGC 
R 


ACA GCA CCT GGA GTT GGC GGC GCC GAG 
TAPGVGGAE 


838 
40 


839 
41 


GGC 

G 


CGA 
R 


GAT 
D 


GGC 
G 


AGG 
R 


ATG ACG 
M T 


GAT 
D 


CGT 
R 


CGG 
R 


GGG 
G 


CCG GAA CTC CCA GGC CGC CCC ACC GTC 
RELPGRRTV 


898 
60 


899 
61 


GCA 
A 


AAC 
N 


CCG 
P 


TCG 
S 


CAA 
Q 


ACC CGT 
T R 


CGC 
R 


AAA 

K 


CCG 
P 


TAA 


GGAGTCATCC ATG AAG ACA GGC ACC GCG 
M K T G T A 


959 
6 


960 
7 


ACC 
T 


ACG 
T 


CGG 
R 


CGC 
R 


AGG 
R 


CTG TTG 
L L 


GCA 
A 


Gift 
V 


CTG 
L 


ATC 
I 


GCC CTC GCG TTG CCG GGG GCC GCC GTT 
ALALPGAAV 


26 


1020 
27 


GCG 
A 


CTG 
L 


CTG 
L 


GCC 
A 


GAA 

E 


CCA TCA 
P S 


GCG 
A 


ACC 
T 


GGC 
G 


GCG 
A 


TCG GAC CCG TGC GCG GCC AGC GAA GTG 
SDPCAASEV 


1079 
46 


1080 
47 


GCG 
A 


AGG 
R 


ACG 
T 


GTC 
V 


GGT 
G 


TCG GTC 
S V 


GCC 
A 


AAG 
K 


TCG 
S 


ATG 
M 


GGC GAC TAC CTG GAT TCA CAC CCA GAG 
GDY LDSHPE 


1139 
66 


1140 
67 


ACC 
T 


AAC 


CAG 
Q 


GTG 
V 


ATG 
M 


ACC GCG 
T A 


GTC 
V 


TTG 
L 


CAG 
Q 


CAG 
Q 


CAG CTA GGG CCG GGG TCG GTC CCA TCG 
QVGPGSVAS 


1199 
86 


1200 
87 


CTG 
L 


AAG 

K 


GCC 
A 


CAT 
H 


TTC 

r 


GAG GCG 
£ A 


AAT 
N 


CCC 
P 


AAG 
K 


GTC 
V 


GCA TCG GAT CC 
A S O 


1243 
100 



SEQ ID N° 1 



FIGURE 5 
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491 CCGCTO^<»SGCOSCT GTG CGC GTC GAG TTG GTC GTG 563 

^ VRVELVV7 

564 GAC CAG CAA TGA (HXXX^CCtrad bj^^ 

fin n n * M ~ — ' ■ := 



640 ACCGCCGGCACTAACX^XZAGCAACCAACCXT GTG AA6 ACC AAC CAA OGG CAC CTG CGC AGG TIG OGG 705 
1 VKTHQRHLRRLR12 



706 
13 


CTC 
L 


AAC 
N 


CGC 
R 


ATC 
I 


ATC 
H 


AAC 
H 


TGC TGG 
C w 


ATT 
I 


TCG 
S 


GAC 
D 


tree 
s 


CCG 
P 


TAC 

y 


TCT CGC GCA GTG CGT GCC 
S R A V R A 


765 
32 


766 
33 


CGC 
R 


GAG 
E 


CCT 
P 


ACC 
T 


GAA 

E 


GAT 
D 


CGC GTG 
R v 


CAT 
H 


GCG 
A 


TTC 
F 


GGC 
G 


GTG 

V 


GAC 
D 


CGC ACA GCA CCT GGA GTT 
R T A P G V 


825 
52 


326 

S3 


GGC 
G 


GGC 
G 


GCC 
A 


GAG 
E 


GGC 
G 


CGA 
R 


GAT GGC 
O G 


AGG 
R 


ATG 
M 


ACG 

T 


GAT 
O 


CGT 
R 


CGG 
R 


GGG CGG GAA CTC CCA GGC 
G R E I* P G 


885 
72 


886 
73 

947 
3 


CGC 
R 

ACA 
T 


CGG 
R 

GGC 
G 


ACC 
T 


GTC 
V 


GCA 
A 


AAC 
t* 


CCG TCG 

P \-/s 


CAA 
Q 


ACC 
T 


CGT 
R 


CGC 
R 


AAA 
K 


CCG 
P 


TAA GGAGTCATCC ATG AAG 
• XXXXXX. M K 


946 
2 


ACC 
T 


GCG 
A 


AOG 
T 


ACG 
T 


CGG CGC 
R R 


AGG 
R 


CTG 
t 


TTG 

L . 


GCA 
A 


GTA 

V 


CTG 


ATC GCC CTC GCG TTG CCG 
T A t A h P 


1006 
22 



1007 GGG GCC GCC GTT 
23 G A A V A 



CTG CTG GCC GAA CCA TCA GCG ACC GGC GCG TCG GAC CCG TGC GCG 1066 
I, h A" EPSATGASDPCA 42 



1067 GCC AGC GAA GTG GCG AGG ACG GTC GGT TCG GTC GCC AAG TCG ATG GGC GAC TAC CTG GAT 1126 

QASEVARTVGSVAKSMGDYLD 62 

1127 TCA CAC CCA GAG ACC AAC CAG GTG ATG ACC GCG GTC TTG CAG CAG CAG GTA GGG CCG GGG 1106 

63 S H P *E T HQ VMTA V LQ Q Q VG P ' G 82 

1187 TCG GTC GCA TCG CTG AAG GCC CAT TTC GAG GCG AAT CCC AAG GTC GCA TCG GAT CTG CAC 1246 

63SVASLKAHFEAWFKVA5DLH 102 

1247 GCG CTT TCG CAA CCG CTG AGC GAT CTT TCG ACT CGG TGC TCG CTG CCG ATC AQC_£QC CTG 1306 

103 A L S Q P L T D L S T P C S |l P I S|G|L 122 

1307 CAG GCG ATC GGT TTG ATG CAG GCG GTG CAG GGC GCC CGC CGG TAG ATG CCG GAC CGC CGC 1366 

I23qAIGLMQAVQGARR | * M P D R R 5 

1367 CGG GTC CGG CGC AGT CGA CGT GAG GCA GCG GTC GCC TAC CGG GGC GGT GTC TCG CCG CCT 1*26 

6RVRRSRREAAVAYRGGVSPP 25 

1427 TCT GGT CGC AGG TCA GGG GTC GGC GCT GGA CCT TGC GGT GTG GTT TCG ACC GGG TCG TCG 1486 

26SGRRSGVGAGPCGVVSTGSS 45 

1487 CAG GGT GTG CCC TGC GGT TGG ATG ACA AGT CGC AGG TTT GGA TCG GTT GGC GGG TCG CGA 1546 

46QGVPCGWMTSRRFGSVGGSR 65 



1547 TCG TTG T 
66 S L 



1553 
67 



SEQ ID N° Z 



FIGURE 6 
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6D7.95-Scq.ll -> 1-phase Translation 

DNA sequence 304 b.p. TCGCCGGCTCGC ... CGCATGCGGATC linear 



1/1 

TCG CCG GCT CGC GGA CGT AGA TAA TAG CTC 
ser pro ala arg gly arg arg OCH AMB leu 
61/21 

TGA CTG CCG GGC TTG ACG CGG ACG ACC ACA 
OPA leu pro gly leu thr arg thr thr thr 
121/41 

TGA CCT GGG GTG CGT GGG CGC CGA CGA GTG 
OPA pro gly val arg gly arg arg arg val 
181/61 

CTC GGT CGC CGG CAG TGT CAG CAT GTG CAG 
leu gly arg arg gin cys gin his val gin 
241/81 

TCG TGG TTG CGA CGA CTT GGC GCT GGT GAG 

ser trp leu arg arg leu gly ala gly glu 

301/101 

GAT C 

asp 



31/11 














ACC GTT 


GGA CGA CCT 


CGA 


CAG 


GGT 


CCT 


TTG 


thr val 


gly arg pro 


arg gin 


gly 


pro 


leu 


91/31 














GAG TCG 


GGT CAT CGC 


CTA 


AGG 


CTA 


CCG 


TTC 


glu ser 


gly his arg 


leu 


arg 


leu 


pro 


phe 


151/51 














AGG CAG 


TCA TGT CTC 


AGG 


GCC 


CAC 


CGC 


CAC 


arg gin 


ser cys leu 


arg 


ala 


his 


arg 


his 


211/71 














ATG ACT 


CCA CGC AGC 


TTG 


TTC 


GTG 


TTG 


GTG 


met thr 


pro arg ser 


leu phe 


val 


leu 


val 


271/91 














CGC ACC 


CGC CGG CGT 


CGT 


GCC 


CCG 


CAT 


GCG 


arg thr 


arg arg arg 


arg 


ala 


ala 


his 


ala 



SEQ ID N° 3 



FIGURE 7A 



2767336 

8/73 



6D7.95-Seq.ll [2 to 304] -> 1-phase Translation 

DNA sequence 304 b.p. TCXXXGGCTCGC ... CGCATGCGGATC linear 



2/1 " 32/11 

CGC CGG CTC GCG GAC GTA GAT AAT AGC TCA CCG TTG GAC GAC CTC GAC AGG GTC CTT TGT 

arg arg leu ala asp val asp asn ser ser pro leu asp asp leu asp arg val leu cys 

62/21 92/31 

GAC TGC CGG GOT TGA CGC GGA CGA CCA CAG ACT CGG GTC ATC GCC TAA GGC TAC CGT TCT 
asp cys arg ala OPA arg gly arg pro gin ser arg val lie ala OCH gly tyr arg ser 

122/41 152/51 

GAC CTG GGG TGC GTG GGC GCC GAC GAG TGA GGC AGT CAT GTC TCA GGG CCC ACC GCC ACC 

asp leu gly cys val gly ala asp glu OPA gly ser his val ser gly pro thr ala thr 

182/61 212/71 

TCG GTC GCC GGC AGT GTC AGC ATG TGC AGA TGA CTC CAC GCA CCT TGT TCG TGT TGG TGT 

ser val ala gly ser val ser met cys arg OPA leu his ala ala cys ser cys trp cys 

242/81 272/91 

CGT GGT TGC GAC GAC TTG GCG CTG GTG AGC GCA CCC GCC GGC GTC GTG CCG CGC ATG CGG 

arg gly cys asp asp leu ala leu val ser ala pro ala gly val val pro arg met arg 

302/101 

ATC 

lie 



SEQ ID H° 3 



FIGURE 7B 
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6D7.95-Scq.ll [3 to 304] -> 1-phasc Translation 

DKA sequence 304 b.p. TCGCCGGCTCGC ... CGCATGCGGATC linear 

3/1 33/11 

GCC GGC ICG CGG ACG TAG ATA ATA GCT CAC CGT TGG ACG ACC TCG ACA GGG TCC TTT GTG 
ala gly ser arg thr AMB Ue ile ala his arg trp thr thr ser thr gly ser phe val 
63/21 93 /31 

ACT GCC GGG CTT GAC GCG GAC GAC CAC AGA GTC GGG TCA TCG CCT AAG GCT ACC GTT CTG 
thr ala gly leu asp ala asp asp his arg val gly ser ser pro lys ala thr val leu 
123/41 153/51 

ACC TGG GGT GCG TCG GCG CCC ACG AGT GAG GCA GTC ATG TCT CAC GCC CCA CCG CCA CCT 
thr trp gly ala trp ala pro thr sec glu ala val met ser gin gly pro pro pro pro 
183/61 213/71 

CGG TCG CCG GCA GTG TCA GCA TGT GCA GAT GAC TCC ACG CAG CTT GTT CGT GTT GGT GTC 
arg ser pro ala val ser ala cys ala asp asp ser thr gin leu val arg val gly val 
243/81 273/91 

GTG GTT GCG ACG ACT TGG CGC TGG TGA GCG CAC CCG CCG GCG TCG TGC CGC GCA TGC GGA 
val val ala thr thr trp arg trp OPA ala his pro pro ala ser cys arg ala cys gly 

TC 



SEQ ID N° 3 



FIGURE 7C 
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5A3.95-Seq.16 -> 1-pbase Translation 

DMA sequence 389 b.p. CCAATTTTCCTT ... ACGACCACGATC linear 



1/1 












31/11 
















CCA ATT 


TTC 


CTT CGC GCC 


GTG 


CAA 


TAC CAT 


CTG CAA 


GAC 


CAG CGA 


CGG 


CCC 


GTG 


GTT 


GCG 


pro ile 


phe 


leu arg ala 


val 


gin 


tyr his 


leu gin 


asp 


gin arg 


arg 


Dro 


val 


val 


ala 


61/21 












91/31 
















GTC GCG 


CAG 


CTT GCG GAA 

vll W^-VJ WVt 


ACC 


GGG 


TAT GGA 


CCC TGC 


CGT 


ACC GTT 








•TV- A 

lun 


IVll 


val ala 


gin 


leu ala glu 


thr 


<ilv 


tvr alv 


pro cys 


arg 


thr val 


val 


ala 


thr 


OPA 


cys 


121/41 












151/51 
















CGT CGC 


TCT 


CCA CCC GTC 


GGG 


GGG 


CGA AAG 


CCA TTC 


CGA 




GAT 


CCT 


CAA 






ara ara 


ser 


pro pro val 


alv 


qIv 


ara lvs 


pro phe 


arg 


his t_rp 


asp 




gin 




val 


181/61 












211/71 
















GGC TGA 


GTG 


TCT GCA GGG 


CTC 


CGG 


GGA GCA 


GCC GAT 


CAT 


CAC CAT 


GTA 


CGA 


ACT 


GAA 


TAA 


gly OPA 


val 


3er ala gly 


leu 


arg 


gly ala 


ala asp 


his 


his his 


val 


arg 


thr 


glu 


OCH 


241/81 












271/91 
















GTC CCC 


CGC 


GCG CGA CTT 


CCA 


GAC 


ATT TGT 


TGT GGT 


TTC 


GGT TGA 


GGC 


CGA 


GGC 


GAG 


GCT 


val pro 


arg 


ala arg leu 


pro 


asp 


lie cys 


cys gly 


phe 


gly OPA 


gly 


arg 


gly 


glu 


ala 


301/101 












331/111 
















CAT TTC 


GCA 


GCA ACC GGT 


CTC 


CGG 


GTC GCA 


GCA TCG 


TTG 


CGG CGA 


TCG 


CGG 


CGC 


AGT 


CGT 


his phe 


ala 


ala thr gly 


leu 


arg 


val ala 


ala ser 


leu 


arg arg 


ser 


arg 


arg 


ser 


arg 


361/121 




























CGG ACG 


AGT 


CGT CGT CAA 


CGA 


CCA 


CGA TC 


















arg thr 


ser 


arg arg gin 


arg 


pro 


arg 



















SEQ ID N° 4 



FIGURE 8A 
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5A3.9S-Seq.l6 [2 to 389] -> 1-phase Translation 

DNA sequence 389 b.p. CCAATTTTCCTT ... ACGACCACGATC linear 



2/1 
















32/11 
















CAA TTT 


TCC 


TTC 


GCG 


CCG 


TGC 


AAT 


ACC ATC 


TGC AAG 


ACC 


AGC GAC 


GGC 


CCG 


TGG 


TTG 


CGG 


gin phe 


ser 


phe 


ala 


pro 


cys 


asn 


thr ile 


cys lys 


thr 


ser asp 


gly 


pro 


trp 


leu 


arg 


62/21 
















92/31 
















TCG CGC 


AGC 


TTG 


CGG 


AAA 


CCG 


GGT 


ATG GAC 


CCT GCC 


GTA 


CCG TTG 


TTG 


CCA 


CTT 


GAT 


GTC 


ser arg 


ser 


leu 


arg 


lys 


pro 


gly 


met asp 


pro ala 


val 


pro leu 


leu 


pro 


leu 


asp 


val 


122/41 
















152/51 














TCG 


GTC GCT 


CTC 


CAC 


CCG 


TCG 


GGG 


GGC 


GAA AGC 


CAT TCC 


GAC 


ACT GGG 


ATC 


CTC 


AAA 


ACG 


val ala 


leu 


his 


pro 


ser 


gly 


gly 


glu ser 


his ser 


asp 


thr gly 




leu 


lys 


t-hr 
UILX 


ser 


182/61 
















212/71 
















GCT GAG 


TGT 


CTG 


CAG 


GGC 


TCC 


GGG 


GAG CAG 


CCG ATC 


ATC 


ACC ATG 


TAC 


GAA 


CTG 


AAT 


AAG 


ala glu 


cys 


leu 


gin 


gly 


ser 


gly 


glu gin 


pro ile 


ile 


thr met 


tyr 


glu 


leu 


asn 


lys 


242/81 
















272/91 














CTC 


TCC CCC 


GCG 


CGC 


GAC 


TTC 


CAG 


ACA 


TTT GTT 


GTG GTT 


TCG 


GTT GAG 


GCC 


GAG 


GCG 


AGG 


ser pro 


ala 


arg 


asp 


phe 


gin 


thr 


phe val 


val val 


ser 


val glu 


ala 


glu 


ala 


arg 


leu 


302/101 
















332/111 














GTC 


ATT TCG 


CAG 


CAA 


CCG 


GTC 


TOC 


GGG 


TCG CAG 


CAT CGT 


TGC 


GGC GAT 


CGC 


GGC 


GCA 


GTC 


lie ser 


gin 


gin 


pro 


val 


ser 


gly 


ser gin 


his arg 


cys 


gly asp 


arg 


gly 


ala 


val 


val 


362/121 
































GGA CGA 


GTC 


GTC 


GTC 


AAC 


GAC 


CAC 


GAT C 


















gly arg 


val 


val 


val 


asn 


asp 


his 


asp 



















SEQ ID N" 4 



FIGURE 8B 



12/73 



2767336 



5A3,95-Seq,16 [3 to 389) -> l-phasc Translation 

DNA sequence 389 b.p. CCAATTTTOCTT ... ACGACCACGATC linear 

3/1 33 /H 

AAT TTT OCT TCG CGC CGT GCA ATA CCA TCT GCA AGA CCA GCG ACG GCC CGT GGT TGC GGT 
asn phe pro ser arg arg ala ile pro ser ala arg pro ala thr ala arg gly cys gly 
63/21 93/31 

CGC GCA GCT TGC GGA AAC CGG GTA TGG ACC CTG CCG TAC CGT TGT TGC CAC TTG ATG TCG 
arq ala ala cys gly asn arg val trp thr leu pro tyr arg cys cys his leu met ser 
123/41 153/51 

TCG CTC TCC ACC CGT CGG GGG GCG AAA GCC ATT CCG ACA CTG GGA TCC TCA AAA CGT CGG 
ser leu ser thr arg arg gly ala lys ala ile pro thr leu gly ser ser lys arg arg 
183/61 2U/71 

CTG AGT GTC TGC AGG GCT CCG GGG AGC AGC CGA TCA TCA CCA TGT ACC AAC TGA ATA AGT 
leu ser val cys arg ala pro gly ser ser arg ser ser pro cys thr asn OPA lie ser 
243/81 273/91 

CCC CCG CGC GCG ACT TCC AGA CAT TTG TTG TGG TTT CGG TTG AGG CCG AGG CGA GGC TCA 
pro pro arg ala thr ser arg his leu leu trp phe arg leu arg pro arg arg gly ser 
303/101 333/111 

TTT CGC AGC AAC CGG TCT OCG GGT CGC AGC ATC GTT GCG GCG ATC GCG GCG CAG TCG TCG 
phe arg ser asn arg ser pro gly arg ser ile val ala ala lie ala ala gin ser ser 
363/121 

GAC GAG TCG TCG TCA ACG ACC ACG ATC 
asp glu ser ser ser thr thr thr lie 



SEQ ID N° 4 
FIGURE 8C 



13/73 



2767336 



5F6 -> l-ph» se Translation 

316 b.P- GATCGCGGTCAA ... CGGTCGCCGATC linear 
DHA sequence r 



1/1 

GAT CGC GGT 
a 3 p ar? 9 lv 
61/21 

TGG CTA CGC 

trp leu arg 

121/41 

GGA GAT GAC 

gly asp «P 

101/61 

CAC CGC CGC 

his arg arg 

241/61 

GCC CAC GCA 

ala his ala 

301/101 

GCA TCG GTC 

ala ser val 



CAA CGA GGC 
gin arg gly 

CGC GGC GAC 
arg gly asp 

CAG CGC GGG 
gin arg gly 

GGC GAA CCA 
gly glu pro 

GGG CAC CAC 
gly his his 

GCC GAT C 
ala asp 



CGA ATA 
arg lie 

GGC GAC 
gly asp 

TGG GCT 
trp ala 

GTT GAT 

val asp 

GCC TTC 
ala phe 



CGG CGA 
arg arg 

GGC GAC 
gly aap 

CCT CGA 

pro arg 

GAA CAA 
glu gin 

TTC CAA 
phe gin 



31/11 

GAT GTG GGC 

asp val gly 
91/31 

GGC GAC GTT 
gly asp val 
151/51 
GCA GGC CGC 

ala gly arg 

211/71 

TGT GCC CCA 

cys ala pro 

271/91 

GCT GGG TGG 

ala gly trp 



CCA AGA CGC 

pro arg arg 

GCT GCC GTT 
ala ala val 

CGC GGT CGA 
arg gly arg 

GGC GCT CCA 
gly ala ala 

CCT GTG GAA 
pro val glu 



CGC CGC GAT GTT 
arg arg asp val 

CGA GGA GGC GCC 
arg gly gly ala 

GGA GGC CTC CGA 

gly gly leu arg 

ACA GCT GGC CCA 
thr ala gly pro 

GAC GGT CTC GCC 
asp gly leu ala 



SEQ ID N° 5 



FIGURE 9A 



14/73 



2767336 



5F6 [2 to 316] -> X-phase Translation 

DMA sequence 316 b.p. GAXCGCCGTCAA ... CGGTCGCCGATC linear 



2/1 32/11 

ATC GCG GTC AAC GAG GCC GAA TAC GGC GAG ATG TGG GCC CAA GAC GCC GCC GCG ATG TTT 
lie ala val asn gla ala glu tyr gly glu met trp ala gin asp ala ala ala met phe 
62/21 92/31 

GGC TAC GCC GCG GCG ACG GCG ACG GCG ACG GCG ACG TTG CTG CCG TTC GAG GAG GCG CCG 
gly tyr ala ala ala thr ala thr ala thr ala thr leu leu pro phe glu glu ala pro 
122/41 152/51 

GAG ATG ACC AGC GCG GGT GGG CTC CTC GAG CAG GCC GCC GCG GTC GAG GAG GCC TCC GAC 
glu met thx sex ala gly gly leu leu glu gin ala ala ala val glu glu ala ser asp 
1B2/61 212/71 

ACC GCC GCG GCG AAC CAG TTC ATG AAC AAT GTG CCC CAG GCG CTG CAA CAG CTG GCC CAG 
thr ala ala ala asn gin leu met asn asn val pro gin ala leu gin gin leu ala gin 
242/81 272/91 

CCC ACG CAG GGC ACC ACG CCT TCT TCC AAG CTG GGT GGC CTG TGG AAG ACG GTC TCG CCG 
pro thr gin gly thr thr pro ser ser ly$ leu gly gly leu trp lys thr val ser pro 
302/101 

CAT CGG TCG CCG ATC 
his arg ser pro ile 



SEQ ID N° 5 
FIGURE 9B 



15/73 



2767336 



5F6 [3 to 316] -> 1-phase Translation 

DNA sequence 316 b.p. GATCGCGGTCAA ... CGGTCGCCGATC linear 



3/1 33/11 

TCG CGG TCA ACG AGG CCG AAT ACG GCG AGA TGT GGG CCC AAG ACG CCG CCG CGA TGT TTG 
ser arg ser thr arg pro ago thr ala arg cys gly pro lys thr pro pro arg cys leu 
63/21 93/31 

GCT ACG CCG CGG CGA CGG CGA CGG CGA CGG CGA CGT TGC TGC CGT TCG AGG AGG CGC CGG 
ala thr pro arg arg arg arg arg arg arg arg arg cys cys arg ser arg arg arg arg 
123/41 153/51 

AGA TGA CCA GCG CGG GTG GGC TCC TCG AGC AGG CCG CCG CGG TCG AGG AGG CCT CCG ACA 
arg OPA pro ala arg val gly ser ser ser arg pro pro arg ser arg arg pro pro thr 
1B3/G1 213/71 

COG CCG CGG CGA AOC ACT TGA TGA ACA ATG TGC CCC AGG CGC TGC AAC AGC TGC CCC AGC 
pro pro arg arg thr ser OPA OPA thr met cys pro arg arg cys asn ser trp pro ser 
243/81 273/91 

CCA CGC AGG GCA CCA CGC OCT CTT CCA AGC TGG GTG GCC TGT GGA AGA CGG TCT CGC CGC 
pro arg arg ala pro arg leu leu pro ser trp val ala cys gly arg org ser arg arg 
303/101 

ATC GGT CGC CGA TC 
xle gly arg arg 



SEQ ID N° 5 
FIGURE 9C 



16/73 



2767336 



-2A29.96-Seq.17 -> 1-phase Translation 

DNA sequence 433 b.p. GGAICCTGATGC ... AAGGAGAAGATC linear 



1/1 31/11 

GGA TCC TGA TGC AAG TGG TCC GGG ATT TGT CGG CAG CCA CGG CGG TCC CGT CGA CCA ACG 
gly ser OPA cys lys trp ser gly ile cys arg gin pro arg arg ser arg arg pro thr 
61/21 91/31 

TTG GTG CAT CCG GGC TGC GAG CAT GCA CGC ACC GAC CAG CGC GGC GAG CGC GGC TAG CTG 
leu val his pro gly cys glu his ala arg thr asp gin arg gly glu arg gly AMB leu 
121/41 151/51 

CTT GCC CAC TGT TCC TCC CTG CCG GCA CCA TGT GCG ACA AGC TTA AGC GCA GCA GTA CCG 
leu ala his cys ser ser leu pro ala pro cys ala thr ser leu ser ala ala val pro 
181/61 211/71 

GCG GTG CCT GGG CAT CCA GCA AAA CGG GGA GCT CAA GAA CGA TTC ATG AAC GAG GGG TCG 
ala val pro gly his pro ala lys arg gly ala gin glu arg phe met asn glu gly ser 
241/81 271/91 

TCA CCA ACG TCG AAA CCG ACG GTT GCC AGC CGG CCC ACG ATA TTG CGT GCT CGA GGG TCC 
ser pro thr ser lys pro thr val ala ser arg pro thr lie leu arg ala arg gly ser 
301/101 331/111 

GCT GTA CCC TCA CCG AAC GTG AGT CCC ACA CCG CGG AGG CGG GCG ACT CTG GCG TCG TTA 
ala val pro ser pro asn val ser pro thr pro arg arg arg ala thr leu ala ser leu 
36V121 391/131 

GCA GCC GAG CTC AAG GTG TCC CGC ACC ACT GTC TCG AAT GCT TTT AAC CGA CCG GAT CCA 
ala ala glu leu lys val ser arg thr thr val ser asn ala phe asn arg pro asp pro 
421/141 

GAA GGA GAA GAT C 
glu gly glu asp 



SEQ ID N° 6 
FIGURE 10A 



17/73 



2767336 



-2A29.96-Seq.17 [2 to 433] -> 1-phase Translation 

DNA sequence 433 b.p. GGATCCTGATGC ... AAGGAGAAGATC linear 



2/1 

GAT CCT GAT GCA AGT GGT OCG GGA TTT GTC 
asp pro asp a la ser gly pro gly phe val 
62/21 

TGG TGC ATC CGG GCT GCG AGC ATG CAC GCA 
trp cys lie arg ala ala ser met his ala 
122/41 

TTG CCC ACT GTT CCT CCC TGC CGG CAC CAT 
leu pro thr val pro pro cys arg his his 
182/61 

CGG TGC CTG GGC ATC CAG CAA AAC GGG GAG 
arg cys leu gly ile gin gin asn gly glu 
242/81 

CAC CAA CGT CGA AAC CGA CGG TTG CCA GCC 
his gin arg arg asn arg arg leu pro ala 
302/101 

CTG TAC OCT CAC CGA ACG TGA GTC CCA CAC 
leu tyr pro his arg thr OPA val pro his 
362/121 

CAG CCG AGC TCA AGG TGT CCC GCA CCA CTG 
gin pro ser ser arg cys pro ala pro leu 
422/141 

AAG GAG AAG ATC 
lys glu lys lie 



32/11 
















GGC AGC 


CAC GGC 


GGT 


CCC 


GTC 


GAC 


CAA 


CGT 


gly ser 


his gly 


gly 


pro 


val 


asp 


gin 


arg 


92/31 














CCG ACC 


AGC GCG 


GOG 


AGC 


GCG 


GCT 


AGC 


TGC 


pro thr 


ser ala 


ala 


ser 


ala 


ala 


ser 


cys 


152/51 














GTG CGA 


CAA GCT 


TAA 


GCG 


CAG 


CAG 


TAC 


CGG 


val arg 


gin ala 


OCH 


ala 


gin 


gin 


tyr 


arg 


212/71 
















CTC AAG 


AAC GAT 


TCA 


TGA 


ACG 


AGG 


GGT 


CGT 


leu lys 


asn asp 


ser 


OPA 


thr 


arg 


gly 


arg 


272/91 
















GGC CCA 


CGA TAT 


TGC 


GTG 


CTC 


GAG 


GGT 


CCG 


gly pro 


arg tyr 


cys 


val 


leu 


glu 


gly 


pro 


332/111 
















CGC GGA 


GGC GGG 


CGA 


CTC 


TGG 


CGT 


CGT 


TAG 


arg gly 


gly gly 


arg 


leu 


trp 


arg 


arg 


AMB 


392/131 
















TCT CGA 


ATG CTT 


TTA 


ACC 


GAC 


CGG 


ATC 


CAG 


ser arg 


met leu 


leu 


thr 


asp 


arg 


ile 


gin 



SEQ ID N° 6 
FIGURE 10B 



18/73 



2767336 



-2A29.96-Seq.17 [3 to 433] -> 1-phase Translation 

DNA sequence 433 b.p. GGATCCTGATGC ... AAGGAGAAGATC linear 



3/1 










33/11 
















ATC CTG 


ATG 


CAA GTG GTC 


CGG GAT TTG 


TCG 


GCA GCC 


ACG GCG 


GTC 


CCG 


TCG 


ACC 


AAC 


GTT 


lie leu 


met 


gin val val 


arg asp leu 


ser 


ala ala 


thr ala 


val 


pro 


ser 


thr 


asn 


val 


63/21 










93/31 
















GGT GCA 


TCC 


GGG CTG CGA 


GCA TGC ACG 


CAC 


CGA CCA 


GCG CGG 


CGA 


GCG 


CGG 


CTA 


GCT 


GCT 


gly did 


Ser 


gly leu arg 


ala cys thr 


his 


arg pro 


a la a rg 


aru 


ala 


arg 


Leu 


a la 


ala 


123/41 










153/51 
















TGC CCA 


^-lv) 


TTY"* r"Tir* fYT 


err can acc 

vA-*v-« um. 


ATG 


TGC GAC 


AAG PTT 

• wAVJ v«Ll 


AAG 


CGC 


AGC 




ACC 




cys pro 


leu 


phe leu pro 


ala gly thr 


met 


cys asp 


lys leu 


lys 


arq 


ser 


ser 


thr 


alv 


183/61 










213/71 
















GGT GCC 


TGG 


GCA TCC AGC 


AAA ACG GGG 


AGC 


TCA AGA 


ACG ATT 


CAT 


GAA 


CGA 


GGG 


GTC 


GTC 


gly ala 


trp 


ala ser ser 


lys thr gly 


ser 


ser arg 


thr ile 


his 


glu 


arg 


gly 


val 


val 


243/81 










273/91 
















ACC AAC 


GTC 


GAA ACC GAG 


GGT TGC CAG 


CCG 


GCC CAC 


GAT ATT 


GCG 


TGC 


TCG 


AGG 


CTC 


CGC 


thr asn 


val 


glu thr asp 


gly cys gin 


pro 


ala his 


asp lie 


ala 


cys 


ser 


arg 


val 


arg 


303/101 










333/111 
















TGT ACC 


CTC 


ACC GAA CGT 


GAG TCC CAC 


ACC 


GCG GAG 


GCG GCC 


GAC 


TCT 


GCC 


GTC 


GTT 


AGC 


cys thr 


leu 


thr glu arg 


glu ser his 


thr 


ala glu 


ala gly 


asp 


ser 


gly 


val 


val 


ser 


363/121 










393/131 
















AGC CGA 


GCT 


CAA GGT GTC 


CCG CAC CAC 


TGT 


CTC GAA 


TGC TTT 


TAA 


CCG 


ACC 


GGA 


TCC 


AGA 


ser arg 


ala 


gin gly val 


pro his his 


cys 


leu glu 


cys phe 


OCII 


pro 


thr 


gly 


ser 


arg 



423/141 

AGG AGA AGA TC 
arg arg arg 



SEQ ID N° 6 
FIGURE 10C 



19/73 

5B5.95-Seq.24 -> 1-phase Translation 



2767336 



DNA sequence 324 b.p. CCGTCGGCAACT ... TCTCACCAGATC linear 



1/1 






31/11 














CCG TCG 


GCA 


ACT TGG CCG CTG AGG TCG 


GCT TGA TCC CTG GGC 


CGA 


GGC 


GGG 


TCA 


GCC 


AAT 


pro ser 


ala 


thr trp pro leu arg ser 


ala OPA ser leu gly 


arg 


<?iy 


gly 


ser 


ala 


asn 


61/21 






91/31 














AGC GGC 


TCC 


ATC GGC TTT GCT GGT AGC 


GGT TCG GCG GGA AGC 


TAG 


CGG 


CGA 


CGT 


TGT 


CGG 


ser gly 


ser 


lie gly phe ala gly ser 


gly ser ala gly ser 


AMB 


arg 


arg 


arg 


cys 


arg 


121/41 






151/51 












TGG CCG 


GTG 


ATA TAT TGG GTC AGA CGG 


GTA TGG CGG CGG CTG 


AGG 


TGA 


TCT 


GCG 


ACA 


CGC 


trp pro 


val 


lie tyr trp val arg arg 


val trp arg arg leu 


arg 


OPA 


ser 


ala 


thr 


arg 


181/61 






211/71 












CGC CGC 


GGT 


GCT CGA GCC AGG CTT ACG 


ACC AGG GAA TTT CGA 


AAA 


TGT 


TAT 


TCA 


GAA 


CAT 


arg arg 


gly 


ala arg ala arg leu thr 


thr arg glu phe arg 


lys 


cys 


tyr 


ser 


glu 


his 


241/81 






271/91 












CTT GTA 


TCT 


CTT CTC CGT GCC ACC CCC 


TAG GTG TAG TGT TTT 


CGA 


GTA 


CCG 


GCA 


GAT 


CCC 


leu val 


ser 


leu leu arg ala thr pro 


AMB val AMB crys phe 


arg 


val 


pro 


ala 


asp 


pro 


301/101 
















AGG rrc 


ACC 


AGG TCT CAC CAG ATC 
















arg phe 


thr 


arg ser his gin ile 

















SEQ ID 



FIGURE 



N° 7 
11A 



20/73 



2767336 



5B5.95-Seq,24 [2 to 324] -> 1-phase Translation 

DNA sequence 324 b.p. CCGTCGGCAACT ... TCTCACCAGATC linear 



VI 32/11 

CGT CGG CAA CTT GGC CGC TGA GGT CGG CTT GAT CCC TGG GCC GAG GCG GGT CAG CCA ATA 
arg arg gin leu gly arg OPA gly arg leu asp pro trp ala glu ala gly gin pro ile 
62/21 92/31 

GCG GCT CCA TOG GCT TTG CTG GTA GCG GTT CGG CGG GAA GCT AGC GGC GAC GTT GTC GGT 
ala ala pro ser ala leu leu val ala val arg arg glu ala ser gly asp val val qly 
122/41 152/51 

GGC CGG TGA TAT ATT GGG TCA GAC GGG TAT GGC GGC GGC TGA GGT GAT CTG CCA CAC GCC 
gly arg OPA tyr ile gly ser asp gly tyr gly gly gly OPA gly asp leu arg his ala 
182/61 212/71 

GCC GCG GTG CTC GAG CCA GGC TTA CGA CCA GGG AAT TTC GAA AAT GTT ATT CAG AAC ATC 
ala ala val leu glu pro gly leu arg pro gly asn phe glu asn val lie gin asn ile 
242/81 272/91 

TTG TAT CTC TTC TCC GTG CCA CCC CCT AGG TCT AGT GTT TTC GAG TAC CGG CAG ATC CCA 
leu tyr leu phe ser val pro pro pro arg cys ser val phe glu tyr arg gin Ue pro 
302/101 

GGT TCA CCA GGT CTC ACC AGA TC 
gly ser pro gly leu thr arg 



SEQ ID N° 7 
FIGURE 11B 



21/73 



2767336 



5BS.95-Seq.24 [3 to 324] -> 1 -phase Translation 

DNA sequence 324 b.p. CCGTCGGCAACT ... TCTCACCAGATC linear 



3/1 
















33/11 














GTC GGC 


AAC 


TTG 


GCC 


GCT 


GAG 


GTC GGC 


TTG 


ATC CCT GGG 


CCG AGG 


CGG 


GTC 


AGC 


CAA 


TAG 


val gly 


asn 


leu 


ala 


ala 


glu 


val gly 


leu 


ile pro gly 


pro arg 


arg 


val 


ser 


qln 


AMB 


63/21 
















93/31 














CGG CTC 


CAT 


CGG 


CTT 


TGC 


TGG 


TAG CGG 


TTC 


GGC GGG AAG 


CTA GCG 


GCG 


ACG 


TTG 


TCG 


GTG 


arg leu 


his 


arg 


leu 


cys 


trp 


AMB arg 


phe 


gly gly lys 


leu ala 


ala 


thr 


leu 


ser 


val 


123/41 
















153/51 














GCC GGT 


GAT 


ATA 


TTG 


GGT 


CAG 


ACG GGT 


ATG 


GCG GCG GCT 


GAG GTG 


ATC 


TGC 


GAC 


ACG 


CCG 


ala gly 


asp 


ile 


leu 


gly 


gin 


thr gly 


met 


ala ala ala 


glu val 


ile 


cys 


asp 


thr 


pro 


183/61 
















213/71 














CCG CGG 


TGC 


TCC 


AGC 


CAG 


GCT 


TAC GAC 


CAG 


GGA ATT TCG 


AAA ATG 


TTA 


TTC 


AGA 


ACA 


TCT 


pro arg 


cys 


ser 


ser 


gin 


ala 


tyr asp 


gin 


gly ile ser 


lys met 


leu 


phe 


arg 


thr 


ser 


243/81 
















273/91 














TGT ATC 


TCT 


TCT 


CCG 


TGC 


CAC 


CCC CTA 


GGT 


GTA GTG TTT 


TCG AGT 


ACC 


GGC 


AGA 


TCC 


CAG 


cys lie 


ser 


ser 


pro 


cys 


his 


pro leu 


gly 


val val phe 


ser sec 


thr 


gly 


arg 


ser 


gin 


303/101 






























GTT CAC 


CAG 


GTC 


TCA 


CCA 


GAT 


C 


















val his 


gin 


val 


ser 


pro 


asp 





















SEQ ID N° 7 
FIGURE 11C 



22/73 

lC7.96-Seq,3 -> 1-phase Translation 



2767336 



DNA sequence 432 b.p. CTTTGCGTGATG ... TCCGCGACGATC linear 



1/1 31/11 



CTT TGC 


GTG 


ATG 


TCC AAT GGC GAA 


AAC 


GAC GCC TTG 


TCA TCG 


CAA 


TCG 


TCA 


GCA 


CCG 


GCC 


leu cys 


val 


met 


ser asn gly glu 


asn 


asp ala leu 


ser 


ser 


gin 


ser 


ser 


ala 


pro 


ala 


61/21 










91/31 


















TAG TTT 


TCG 


CGA 


TGA CGC TCG TTC 


TGA 


CCG GAC TTG 


TGA 


ACG 


GGT 


TTC 


GGG 


TCG 


AGG 


CCG 


AMB phe 


ser 


arg OPA arg ser phe 


OPA 


pro asp leu 


OPA 


thr 


gly 


phe 


gly 


ser 


arg 


pro 


121/41 










151/51 


















AGC GAA 


OCG 


TCG 


ATT CCA TGG GTG 


TCG 


ACG CAT TCG 


TGG 


TCA 


AGG 


CCG 


GCC 


CGG 


CAG 


GAC 


ser gla 


pro 


ser 


ile pro trp val 


ser 


thr his ser 


trp 


ser 


arg 


pro 


ala 


arg 


gin 


asp 


181/61 










211/71 


















CGT TCC 


TGG 


GTT CGA CAC CAT TCG CCC 


AAA TCG ACC 


TGC 


CCC 


AGG 


TTG 


CTC 


GTG 


CGC 


CTG 


arg ser 


txp 


val 


arg his his ser 


pro 


lys ser thr cys pro 


arg 


leu 


leu 


val 


arg 


leu 


241/81 










271/91 


















GOG TCT 


TGG 


CTG 


CCG CCC CAC TAG 


CGA 


CTG CGC CGT 


CGA 


CGA 


TCC 


GGC 


AGG 


GCA 


CGT 


CAG 


a la ser 


txp 


leu 


pro pro his AMB 


arg 


leu arg arg 


arg 


arg 


ser 


gly 


arg 


ala 


arg 


gin 


301/101 










331/111 


















CGC GAA 


ACG 


TCA 


CCG CGT TCG GGG 


CAC 


CAG AGC ACG GAC 


CCG 


GCA 


TGC 


CGC 


GGG 


TCT 


CGG 


arg glu 


thr 


ser 


pro arg ser gly his 


gin ser thr 


asp 


pro 


ala 


cys 


arg 


gly 


ser 


arg 


361/121 










391/131 


















ACG GTC 


GGG 


CGC 


CAT CGA CGC CGG 


ACG 


AGG TCG CGG 


TGT 


CGA 


GCA 


CGC 


TGG 


GCC 


GAA 


ACC 


thr val 


gly 


arg 


his arg arg arg 


thr 


arg ser arg 


cys 


arg 


ala 


arg 


trp 


ala 


glu 


thr 



421/141 
TCG GCG ACG ATC 
ser ala thr ile 



SEQ ID N° 8 
FIGURE 12A 



oo^o 2767336 
23/73 



-lC7.96-Seq.3 [2 to 432] -> i-phase Translation 

DNA sequence 432 b-p. CTTTGCGTGATG ... TCGGCGACGATC linear 



2/1 

TTT GCG TGA TGT CCA ATG GCG AAA ACG ACG 
phe a la OPA cys pro met ala lys thr thr 
62/21 

AGT TTT CGC GAT GAC GCT CGT TCT GAC CGG 
ser phe arg asp asp ala arg ser asp arg 
122/41 

GCG AAC CGT CGA TTC CAT GGG TGT CGA CGC 
ala asn arg arg phe his gly cy3 arg arg 
182/61 

GTT CCT GGG TTC GAC ACC ATT CGC CCA AAT 
val pro gly phe asp thr ile arg pro asn 
242/81 

CGT CTT GGC TGC CGC CCC ACT AGC GAC TGC 
arg leu gly cys arg pro thr ser asp cys 
302/101 

GCG AAA CGT CAC CGC GTT CGG GGC ACC AGA 
ala lys arg his arg val arg gly thr arg 
362/121 

CGG TCG GGC GCC ATC GAC GCC GGA CGA GGT 
arg ser gly ala ile asp ala gly arg gly 
422/141 

CGG CGA CGA TC 
arg arg arg 



32/11 


















CCT TGT 


CAT 


CGC 


AAT 


CGT 


CAG 


CAC 


CGG 


CCT 


pro cys 


his 


arg 


asn 


arg 


gin 


his 


arg 


pro 


92/31 
















ACT TGT 


GAA 


CGG 


GTT 


TCG 


GGT 


CGA 


GGC 


CGA 


thr cys 


glu 


arg 


val 


ser 


gly 


arg 


gly 


arg 


152/51 


















ATT CGT 


GGT 


CAA 


GCC 


CGG 


CGC 


GGC 


AGG 


ACC 


ile arg 


gly 


gin gly 


arg 


arg 


gly 


arg 


thr 


212/71 


















CGA CCT 


GCC 


CCA 


GGT 


TGC 


TCG 


TGC 


GCC 


TCG 


arg pro 


ala 


pro gly 


cys 


ser 


cys 


ala 


trp 


272/91 


















GCC GTC 


GAC 


GAT 


COG 


GCA 


GGC 


CAC 


GTC 


AGC 


ala val 


asp 


asp 


pro 


ala 


gly 


his 


val 


ser 


332/111 


















GCA CGG 


ACC 


CGG 


CAT 


GCC 


GCG 


GGT 


CTC 


GGA 


ala arg 


thr 


arg 


his 


ala 


ala 


gly 


leu 


gly 


392/131 


















CGC GGT 


GTC 


GAG 


CAC 


GCT 


GGG 


CCC 


AAA 


CCT 


arg gly 


val 


glu 


his 


ala 




pro 


lys 


pro 



SEQ ID N° 8 
FIGURE 12B 



2767336 

24/73 

-lC7.96-Seq.3 [3 to 432] -> 1-phase Translation 

DNA sequence 432 b.p. CTTTGCGTGATC ... TCGGCGACGATC linear 



3/1 






33/11 
















TTG CGT GAT GTC 


CAA TGG CGA AAA CGA 


CGC 


CTT GTC 


ATC GCA 


ATC 


GTC 


AGC 


ACC 


GGC 


CTA 


leu arg asp val 


gin trp arg lys arg 


arg 


leu val 


lie ala 


ile 


val 


ser 


thr 


a 1 v 


leu 


63/21 






93/31 














GTT TTC GCG ATG 


ACG CTC GTT CTG ACC 


GGA 


CTT GTG 


AAC GGG 


TTT 


CGG 


GTC 


GAG 


GCC 


GAG 


val phe ala met 


thr leu val leu thr 


gly 


leu val 


asn gly 


phe 


ara 


val 


<ilu 


ala 


glu 


123/41 






153/51 












CGA ACC GTC GAT 


TCC ATG GGT GTC GAC 


GCA 


TTC GTG 


GTC AAG 


GCC 


GGC 


GCG 


GCA 


GGA 


CCG 


arg thr val asp 


ser met gly val asp 


ala 


phe val 


val lys 


ala 


gly 


ala 


ala 


gly 


pro 


183/61 






213/71 












TTC CTG GGT TCG 


ACA CCA TTC GCC CAA 


ATC 


GAC CTG 


CCC CAG 


GTT 


GCT 


CGT 


GCG 


CCT 


GGC 


phe leu gly ser 


thr pro phe ala gin 


lie 


asp leu 


pro gin 


val 


ala 


arg 


ala 


pro 


gly 


243/81 






273/91 














GTC TTG GCT GOC 


GCC CCA CTA GCG ACT 


GCG 


CCG TCG 


ACG ATC 


CGG 


CAG 


GGC 


ACG 


TCA 


GCG 


val leu ala ala 


ala pro leu ala thr 


ala 


pro ser 


thr lie 


arg 


gin 


gly 


thr 


ser 


ala 


303/101 






333/111 














CGA AAC GTC ACC 


GCG TTC GGG GCA CCA 


GAG 


CAC GGA 


CCC GGC 


ATG 


CCG 


CGG 


GTC 


TCG 


GAC 


arg asn val thr 


ala phe gly ala pro 


glu 


his gly 


pro gly 


met 


pro 


arg 


val 


ser 


asp 


363/121 






393/131 












GGT CGG GCG CCA 


TCG ACG CCG GAC GAG 


GTC 


GCG GTG 


TCG AGC 


ACG 


CTG 


GCC 


CGA 


AAC 


CTC 


gly arg ala pro 


ser thr pro asp glu 


val 


ala val 


ser ser 


thr 


leu 


gly 


arg 


asn 


leu 



423/141 
GGC GAC GAT C 
gly asp asp 



SEQ ID N° 8 
FIGURE 12C 



2767336 

25/73 

2D7.95-Seq.2 -> 1-phase Translation 

DHA sequence 320 b.p. CGAGGCCGAGCG ... TCGGCGACGATC linear 



1/1 








31/11 














CGA GGC 


CGA 


GOG 


AAC CGT 


CGA TTC CAT GGG TGT CGA CGC ATT 


CGT 


GGT 


CAA 








ara alv 

j j j 


ara 


ala 


asn a rg 


arg phe his gly cys arg arg ile 


arg 


gly 


gin 


gly 


arg 


arg 


61/21 




















GGC AGG 




GTT 


\A- 1 uuu 


T*7T* fiAf AfV ATT* fYTT* fV"»fc kat rv*A 


CCT 


GCC 


CCA 


GGT 


TGC 


TCG 


gly arg 


thr 


val 


nro alv 


phe asp thr ile arg pro asn arg 




ala 


pro 


gly 


cys 


ser 


121/41 








151/51 












TGC GCC 


TGG 


CGT 


CTT GGC 


TGC CGC CCC ACT AGC GAC TGC GCC 


GTC 


GAC 


GAT 


CCG 


GCA 


GGG 


cys ala 


trp 


arg 


leu gly 


cys arg pro thr ser asp cys ala 


val 


asp 


asp 


pro 


ala 


gly 


181/61 








211/71 










CAC GTC 


AGC 


GCG 


AAA CGT 


CAC CGC GTT CGG GGC ACC AGA GCA 


CGG 


ACC 


CGG 


CAT 


GCC 


GCG 


his val 


ser 


ala 


lys arg 


his arg val arg gly thr arg ala 


arg 


thr 


arg 


his 


ala 


ala 


241/B1 








271/91 












GGT CTC 


GGA 


CGG 


TCG GGC 


GCC ATC GAC GCC GGA CGA GGT CGC 


GGT 


GTC 


GAG 


CAC 


GCT 


GGG 


gly leu 


gly 


arg 


ser gly 


ala ile asp ala gly arg gly arg 


giy 


val 


glu 


his 


ala 


gly 


301/101 














CCG AAA 


CCT 


CGG 


CGA CGA 


TC 














pro lys 


pro 


arg 


arg arg 

















SEQ ID N° 9 
FIGURE 13A 



2767336 

26/73 

2D7.95-Seq.2 [2 to 320] -> 1- phase Translation 

DNA sequence 320 b.p. CGAGGCCGAGCG ... TCGGCGACGATC linear 

2 /l 32/11 

GAG GCC GAG CGA ACC GTC GAT TCC ATG GGT GTC GAC GCA TTC GTG GTC AAG GCC GGC GCG 
glu ala glu arg thr val asp ser met gly val asp ala phe val val lys ala gly ala 
62/21 92/31 

GCA GGA CCG TTC CTG GGT TCG ACA CCA TTC GCC CAA ATC GAC CTG CCC CAG GTT GCT CGT 
ala gly pro phe leu gly ser thr pro phe ala gin lie asp leu pro gin val ala arq 
122/41 152 /51 * 

GCG CCT GGC GTC TTC GCT GCC GCC CCA CTA GCG ACT GCG CCG TCG ACG ATC CGG CAG GGC 
ala pro gly val leu ala ala ala pro leu ala thr ala pro ser thr ile arq qln alv 
182/61 212/71 * * 

ACG TCA GCG OGA AAC GTC ACC GCG TTC GGG GCA CCA GAG CAC GGA CCC GGC ATG CCG CGG 
thr ser ala arg aso val thr ala phe gly ala pro glu his gly pro gly met pro arg 
242/81 272/91 

GTC TCG GAC GGT CGG GCG CCA TCG ACG CCG GAC GAG GTC GCG GTG TCG AGC ACG CTG GGC 
val ser asp gly arg ala pro ser thr pro asp glu val ala val ser ser thr leu alv 
302/101 7 
CGA AAC CTC GGC GAC GAT C 
arg asn leu gly asp asp 



SEQ ID N° 9 
FIGURE 13B 



27/73 2767336 

2D7.95-Seq.2 [3 to 320J -> 1-phase Translation 

DNA sequence 320 b.p. CGAGGCCGAGCG ... TCGGCGACGATC linear 

VI 33/11 

AGG CCG AGC GAA CCG TCG ATT CCA TGG GTG TCG ACG CAT TCG TGG TCA AGG CCG GCG CGG 
arg pro ser glu pro ser lie pro trp val ser thr his sec trp ser arg pro a la arg 
63/21 93 /3l 

CAG GAC CGT TCC TGG GTT CGA CAC CAT TCG CCC AAA TCG ACC TGC CCC AGG TTG CTC GTG 
gin asp arg ser trp val arg his his ser pro lys ser thr cys pro arg leu leu val 
123/41 153 /51 

CGC CTG GCG TCT TGG CTG CCG CCC CAC TAG CGA CTG CGC CGT CGA CGA TCC GGC AGG GCA 
arg leu ala ser trp leu pro pro his AMB arg leu arg arg arg arg ser gly arg ala 
183/61 213/71 

CGT CAG CGC GAA ACG TCA CCG CGT TCG GGG CAC CAG AGC ACG GAC CCG GCA TGC CGC GCG 
arg gin arg glu thr ser pro arg ser gly his gin ser thr asp pro ala cys arq qly 
243/81 273/91 

TCT CGG ACG GTC GGG CGC CAT CGA CGC CGG ACG AGG TCG OGG TGT CGA GCA CGC TGG GCC 
ser arg thr val gly arg his arg arg arg thr arg ser arg cys arg ala arg trp ala 
303/101 

GAA ACC TCG GCG ACG ATC 
glu thr ser ala thr He 



SEQ ID N° 9 
FIGURE 13C 



2767336 

28/73 

-1B7-Seq.21 -> 1-phase Translation 

DNA sequence 445 b.p. TTAACGACTCAG ... CGCATGCGGATC linear 

VI 31/11 

TTA ACG ACT CAG ACG GAA ACG CTT GAACCGCGAGGTCGCTCCGGACAC CAA TTT GAC TCG 
leu thr thr gin thr glu thr leu glu pro arg gly arg ser gly his gin phe asp ser 
61/21 91/ 31 

GCT CTT TGG CAA TTG AAG GTG AGC TGC GAG CAG CCG GGT GAC CGC ATC GTT GGC CTT GCC 
ala leu trp gin leu lys val ser cys glu gin pro gly asp arg lie val gly leu ala 
121/41 X51/51 

ATC AAT CGC CGG CTC GCG GAC GTA GAT AAT CAG CTC ACC GTT GGG ACC GAC CTC GAC CAG 
lie asn arg arg leu ala asp val asp asn gin leu thr val gly thr asp leu asp gin 
181/61 211/71 

GGG TCC TTT GTG ACT GCC GGG CTT GAC GCG GAC GAC CAC AGA GTC GGT CAT CGC CTA AGG 
gly ser phe val thr ala gly leu asp ala asp asp his arg val gly his arq leu arq 
241/81 271/91 

CTA CCG TTC TGA CCT GGG GCT GCG TGG GCG CCG ACG ACG TGA GGC ACG TCA TGT CTC AGC 
leu pro phe OPA pro gly ala ala trp ala pro thr thr OPA gly thr ser cys leu ser 
301/101 331/m 

GGC OCA CCG CCA CCT CGG TCG CCG GCA GTA TGT CAG CAT GTG CAG ATG ACT CCA CGC AGC 
gly pro pro pro pro arg ser pro ala val cys gin hi3 val gin met thr pro arg ser 
361/121 391/131 

CTT GTT CGC ATC GTT GGT GTC GTG GTT GCG ACG ACC TTG GCG CTG GTG AGC GCA CCC GCC 
leu val arg lie val gly val val val ala thr thr leu ala leu val ser ala pro ala 
421/141 

GGC GGT CGT GCC GCG CAT GOG GAT C 
gly gly arg ala ala his ala asp 



SEQ ID N° 10 
FIGURE 14A 



29/73 

-1B7-Seq.21 [2 to 445] -> 1-phase Translation 



2767336 



DNA sequence 445 b.p. TTAACGACTCAG ... CGCATGCGGATC linear 



2/1 








32/11 












TAA CGA CTC 


AGA CGG AAA OGC TTG 


AAC 


CGC 


GAG GTC GCT CCG GAC 


ACC 


AAT 


TTG 


ACT 


CGG 


OCH arg leu 


arg arg lys arg leu 


asn 




glu val ala pro asp 


thr 


asn 


leu 


thr 


arg 


62/21 








92/31 










PTP TTT GGC 

\*&V* 1X1 


AAT TGA AGG TGA OCT 


GCG 


AGC 


agc ccztz {vrtz Ann gca 

**** VAjVa VjXV> n»A. V)*wJ* 






vAA* 


TTG 




leu phe gly 


asn OPA arg OPA ala 


ala 


ser 


ser arg val thr ala 


ser 


leu 


ala 




pro 


122/41 








152/51 










TCA ATC GCC 


GGC TCG CGG AGG TAG 


ATA 


ATC 


AGC TCA fff, T*m CfZIk. 




APT* 


IVAj 


nu. 




ser lie ala 


gly ser arg thr AMB 


lie 


He 


ser ser pro leu gly 


pro 


thr 


ser 


thr 


ara 


182/61 








212/71 










GGT CCT TTG 


TGA CTG CCG GGC TTG 


ACG 


CGG 


ACG ACC ACA GAG TCG 


GTC 


ATC 


GCC 


TAA 


GGC 


gly pro leu 


OPA leu pro gly leu 


thr 


arg 


thr thr thr glu ser 


val 


He 


ala 


OCH 


gly 


242/81 








272/91 










TAC CGT TCT 


GAC CTG GGG CTG CGT 


GGG 


CGC 


CGA CGA CGT GAG GCA 


CGT 


CAT 


GTC 


TCA 


GCG 


tyr arg ser 


asp leu gly leu arg 


gly 


arg 


arg arg arg glu ala 


arg 


his 


val 


ser 


ala 


302/101 








332/111 












GCC CAC CGC 


CAC CTC GGT CGC CGG 


CAG 


TAT 


GTC AGC ATG TGC AGA 


TGA 


CTC 


CAC 


GCA 


GCC 


ala his arg 


his leu gly arg arg 


gin 


tyr 


val ser met cys arg 


OPA 


leu 


his 


ala 


ala 


362/121 








392/131 












TTG TTC GCA 


TCG TTG GTG TCG TGG 


TTG 


CGA 


CGA CCT TGG CGC TGG 


TGA 


GCG 


CAC 


CCG 


CCG 


leu phe ala 


ser leu val ser trp 


leu 


arg 


arg pro trp arg trp 


OPA 


ala 


his 


pro 


pro 



422/141 

GCG GTC GTG CCG CGC ATG CGG ATC 
ala val val pro arg met arg He 



SEQ ID N° 10 
FIGURE 14B 



30/73 



2767336 



-1B7-Seq.21 {3 to 445] -> 1-phase Translation 

DNA sequence 445 b.p. TTAACGACTCAG . . . CGCATGCGGATC linear 

3/1 33/11 

AAC GAC TCA GAC GGA AAC OCT TGA ACC GCG AGG TCG CTC CGG ACA CCA ATT TGA CTC GGC 
asn asp ser asp gly asn ala OPA thr ala arg ser leu arg thr pro He OPA leu gly 
63/21 93/31 

TCT TTG GCA ATT GAA GGT GAG CTG CGA GCA GCC GGG TGA CCG CAT CGT TGG OCT TGC CAT 
ser leu ala ile glu gly glu leu arg ala ala gly OPA pro his arg trp pro cys his 
123/*1 153/51 

CAA TCG CCG GCT CGC GGA CGT AGA TAA TCA GCT CAC CGT TGG GAC CGA OCT CGA CCA GGG 
gin ser pro ala arg gly arg arg OCH ser ala his arg trp asp arg pro arg pro gly 
183/61 213/71 

GTC CTT TCT GAC TGC CGG GCT TGA CGC GGA CGA CCA CAG AGT CGG TCA TCG OCT AAG GCT 
val leu cys asp cys arg ala OPA arg gly arg pro gin ser arg ser ser pro lys ala 
243/81 273/91 

ACC GTT CTG ACC TGG GGC TGC GTG GGC GCC GAC GAC GTG AGG CAC GTC ATG TCT CAG CGG 
thr val leu thr trp gly cys val gly ala asp asp val arg his val met ser gin arq 
303/101 333/111 

CCC ACC GCC ACC TCG GTC GCC GGC AGT ATG TCA GCA TGT GCA GAT GAC TCC ACG CAG OCT 
pro thr ala thr ser val ala gly ser met ser ala cys ala asp asp ser thr qln pro 
363/121 3 93/131 P 

TGT TCG CAT CGT TGG TGT CGT GGT TGC GAC GAC CTT GGC GCT GGT GAG CGC ACC CGC CGG 
cys ser his arg trp cys arg gly cys asp asp leu gly ala gly glu arg thr arg arg 
423/141 

CGG TCG TGC CGC GCA TGC GGA TC 
arg ser cys arg ala cys gly 



SEQ ID N° 10 
FIGURE 14C 



2767336 

31/73 

DP1034-Seq. 18 -> 1-phase Translation 

DNA sequence 510 b.p. CCCGAAGAGGTC ... CGTGACCAGATC linear 

1/1 31/11 

CCC GAA GAG GTC OCC CGT TTT GTT AAT TTT TAA AAA ATT TGT GTC ACA AAG CGG GGT ACC 
pro glu glu val pro arg phe val asn phe OCH lys lie cys val thr lys arg gly thr 
61/21 91/31 

AAG GCA TAA AAC CTA GTA OCT GGG GCG GCG GAT TCA ACG AAA ACC GAG TGG GGG TAG TCA 
lys ala OCH asn leu val pro gly a la ala asp ser thr lys thr glu trp gly AMB ser 
121/41 151/51 

GGG GCG TGC ATT CCG ACG ACC CTG TAC GAC CCG CTG GTG GCA ACC CCG ATG ACT GCG CCG 
gly ala cys tie pro thr thr leu tyr asp pro leu val ala thr pro met ser ala pro 
18V61 211/71 

ACG AAG GCC GAG CGA CGG GCT GCC GGC GCT GAC CGC CGC GGA AGC CCC CGA GTG GAT GGT 
thr lys ala glu arg arg ala ala gly ala asp arg arg gly ser arg arg val asp gly 
241/81 271/91 

CAC CAC CGC CCG CAC CCG ACC GGT ACG GAT CGC GCC TOG GGT TAC CGT CGC CGT CAA CGC 
his his arg pro his pro thr gly thr asp arg ala ser gly tyr arg arg arg gin arg 
301/101 331/111 

GCT GGA GAG CAT CGG TCC CCG CTG GGT CAA TGC ACT CAT GCA GCG CCG CAA CGA ACA GCT 
ala gly gin his arg ser pro leu gly gin cys thr his ala ala pro gin arg thr ala 
36V121 391/131 

CAA CCC TTG AAC CGG GTC CCG GCC TGC CGA CCC TCG GCC GCC GGC GTG CCG CTA CGT GAT 
gin pro leu asn arg val pro ala cys arg pro ser ala ala gly val pro leu arg asp 
42V141 451/151 

AGA CAC AGG GCC ATG GAA ATC CTG GCC AGC CGG ATG CTA CTT CGG CCG GCG GAC TAT CAG 
arg his arg ala met glu ile leu ala ser arg met leu leu arg pro aia asp tyr gin 
481/161 

CGG TCG CTG AGC TTC TAC CGT GAC CAG ATC 
arg ser leu ser phe tyr arg asp gin lie 



SEQ ID N° 1 1 
FIGURE ISA 



32/73 2767336 

DP1034-Seq. 18 [2 to 510J -> 1-phase Translation 

DNA sequence 510 b.p. CCCGAAGAGGTC ... CGTGACCAGATC linear 

2/1 32/11 

CCG AAG AGG TOC CCC GTT TTG TTA ATT TTT AAA AAA TTT GTG TCA CAA AGC GGG GTA CCA 
pro lys arg ser pro val leu leu iie phe lys lys phe val ser gin ser gly val pro 
62/21 92/31 

AGG CAT AAA AOC TAG TAG CTG GGG CGG CGG ATT CAA CGA AAA COG AGT GGG GGT AGT CAG 
arg his lys thr AMB tyr leu gly arg arg Ue gin arg lys pro ser gly gly ser gin 
122/41 X52/51 

GGG CGT GCA TTC CGA CGA CDC TGT ACG ACC CGC TGG TGG CAA CGC CGA TGA GTG CGC CGA 
gly arg ala phe arg arg pro cys thr thr arg trp trp gin arg arg OPA val arg arg 
182/61 . 212/71 

CGA AGG CCG AGC GAC GGG CTG CCG GCG CTG ACC GCC GCG GAA GCC GCC GAG TGG ATG GTC 
arg arg pro ser asp gly leu pro ala leu thr ala ala glu ala ala glu trp met val 
242/81 272/91 

ACC ACC GCC CGC ACC CGA COG GTA CGG ATC GCG CCT CGG GTT ACC GTC GCC GTC AAC GCG 
thr thr ala arg thr arg pro val arg lie ala pro arg val thr val ala val asn ala 
302/101 332/111 

CTG GAC AGC ATC GGT CCC CGC TGG GTC AAT GCA CTC ATG CAG CGC CGC AAC GAA CAG CTC 
leu asp ser lie gly pro arg trp val asn ala leu met gin arg arg asn glu gin leu 
362/121 392/131 

AAC CCT TGA ACC GGG TCC CGG CCT GCC GAC CCT CGG CCG CCG GCG TGC CGC TAC GTG ATA 
asn pro OPA thr gly ser arg pro ala asp pro arg pro pro ala cys arg tyr val lie 
422/141 452/151 

GAC ACA GGG CCA TGG AAA TCC TGG CCA GCC GGA TGC TAC TTC GCC CGG CGG ACT ATC AGC 
asp thr gly pro trp lys ser trp pro ala gly cys tyr phe gly arg arg thr lie ser 
482/161 

GGT CGC TGA GCT TCT ACC GTG ACC AGA TC 
gly arg OPA ala ser thr val thr arg 



SEQ ID N* 11 
FIGURE 15B 



33/73 



2767336 



DP1034-Scq. 18 [3 to .510] -> 1-phase Translation 

DNA sequence 510 b.p. CCCGAAGAGGTC . CGTGACCAGATC linear 

3/1 33/11 

CGA AGA GGT CCC CCG TTT TGT TAA TTT TTA AAA AAT TTG TGT CAC AAA GCG GGG TAC CAA 
arg arg gly pro pro phe cys OCH phe leu lys asn leu cys his lys ala gly tyr gin 
63/21 93/31 

GGC ATA AAA CCT AGT ACC TGG GGC GGC GGA TTC AAC GAA AAC CGA GTG GGG GTA GTC AGG 
gly lie lys pro ser thr trp gly gly gly phe asn glu asn arg val gly val val arg 
123/41 153/51 

GGC GTG CAT TCC GAC GAC CCT GTA CGA CCC GCT GGT GGC AAC GOC GAT GAG TGC GCC GAC 
gly val his ser asp asp pro val arg pro ala gly gly asn ala asp glu cys ala asp 
183/61 213/71 

GAA GGC CGA GOG ACG GGC TGC CGG CGC TGA CCG CCG GGG AAG CCG CCG AGT GGA TGG TCA 
glu gly arg ala thr gly cys arg arg OPA pro pro arg lys pro pro ser gly trp ser 
243/81 273/91 

CCA CCG CCC GCA CCC GAC CGG TAC GGA TOG CGC CTC GGG TTA CCG TCC CCG TCA ACG CGC 
pro pro pro ala pro asp arg tyr gly ser arg leu gly leu pro ser pro ser thr arg 
303/101 333/111 

TGG AGA GCA TCG GTC CCC GCT GGG TCA ATG CAC TCA TGC AGC GCC GCA ACG AAC AGO TCA 
trp thr ala ser val pro ala gly ser met his ser cys ser ala ala thr asn ser ser 
363/121 393/131 

ACC CTT GAA CCG GGT CCC GGC CTG CCG ACC CTC GGC CGC CGG CGT GCC GCT ACG TGA TAG 
thr leu glu pro gly pro gly leu pro thr leu gly arg arg arg ala ala thr OPA AMB 
423/141 453/151 

ACA CAG GGC CAT GGA AAT CCT GGC CAG CCG GAT GCT ACT TCG GCC GGC GGA CTA TCA GCG 
thr gin gly his gly asn pro gly gin pro asp ala thr ser ala gly gly leu ser ala 
483/161 

GTC GCT GAG CTT CTA CCG TGA CCA GAT C 
val ala glu leu leu pro OPA pro asp 



SEQ ID N° 11 
FIGURE 15C 



2767336 

34/73 

-2A23-Seq. 15 -> l-phase Translation 

DNA sequence 316 b.p. GACCGAAGGGAT TCCGGAGTGATC linear 

VI 31/11 

GAC CGA AGG GAT TTC GCG ACT AAC TCG GCC TCT AAG GCA ACG CGA GGT CTT CAT GCC GAG 
asp arg arg asp phe ala thr asn ser ala cys lys ala thr arg gly leu his ala glu 
61/21 91/31 

GAC GTA GAC AGG AAG AGA CAG GGA AGC TGA TGA CGT CGC GTA COG GAC CGC CAT TCT GTC 
asp val asp arg lys arg gin gly ser OPA OPA arg arg val pro asp arg his ser val 
12V41 151/51 

GAG TCT TTC CGA GTT CAG CAA CAA TCG ACA CAG AAG CGG GGA CCA GAC CGG GAG GAC GAC 
glu ser phe arg val gin gin gin ser thr gin lys arg gly pro asp arg glu asp asp 
18V61 211/71 

GCG GCC CGG GCC GCT TCG GGC CGA GTG TCT GAG TAA GAC CAG AGT CAC GGG ICC GTG TCT 
ala ala arg ala ala ser gly arg val ser glu OCH asp gin ser his gly ser val cys 
241/81 271/91 

GAC AAC CGC GCG GAA TTC AAT CGG ATG GCG GGC GGG ACC GGA TTC CGC CGG TCA CCG AGG 
asp asn arg ala glu phe asn arg met ala gly gly thr gly leu arg arg ser pro arg 
301/101 

AAC CTC CGG AGT GAT C 
asn leu arg ser asp 



SEQ ID N° 12 
FIGURE 16A 



^ , 2767336 
35/73 

-2A23-Scq. 15 [2 to 316] -> 1-phase Translation 

DNA sequence 316 b.p. GACOGAAGGGAT ... TCCGGAGTGATC linear 



2/1 32/11 

ACC GAA GGG ATT TCG CGA CTA ACT CGG CCT GTA AGG CAA CGC GAG GTC TTC ATG COG AGG 
thr glu gly ile ser arg leu thr arg pro val arg gin arg glu val phe met pro arg 
62/21 92/31 

ACG TAG ACA GGA AGA GAG AGG GAA GCT GAT GAC GTC GCG TAC CGG ACC GCC ATT CTG TCG 
thr AMB thr gly arg asp arg glu ala asp asp val ala tyr arg thr ala ile leu ser 
122/41 152/51 

ACT CTT ICC GAG TTC AGC AAC AAT CGA CAC AGA AGC GGG GAC CAG ACC GGG AGG ACG ACG 
ser leu ser glu phe ser asn asn arg his arg ser gly asp gin thr gly arg thr thr 
182/61 212/71 

CGG CCC GGG COG CTT CGG GCC GAG TGT CTG ACT AAG ACC AGA GTC ACG GGT CCG TGT GTG 
arg pro gly pro leu arg ala glu cys leu ser lys thr arg val thr gly pro cys val 
242/81 272/91 

ACA ACC GCG CGG AAT TCA ATC GGA TGG CGG GOG GGA CCG GAT TGC GCC GGT CAC CGA GGA 
thr thr ala arg asn ser ile gly trp arg ala gly pro asp cys ala gly his arg gly 
302/101 

ACC TCC GGA GTG ATC 
thr ser gly val ile 



SEQ ID N° 12 
FIGURE 16B 



36/73 



2767336 



-2A23-Seq. 15 [3 to 316] -> 1-phase Translation 

DNA sequence 316 b.p. GACCGAAGGGAT ... TCCGGAGTGATC linear 



3/1 33/11 

CCG AAG GGA TTT CGC GAC TAA CTC GGC CTG TAA GGC AAC GOG AGG TCT TCA TGC CGA GGA 
pro lys gly phe arg asp OCH leu gly leu OCH gly asn a la arg ser ser cys arg gly 
63/21 93/31 

CGT AGA CAG GAA GAG ACA GGG AAG CTG ATG ACG TCG CGT ACC GGA CCG CCA TIC TGT CGA 
arg arg gin glu glu thr gly lys leu met thr ser arg thr gly pro pro phe cys arg 
123/41 153/51 

GTC TTT CCG AGT TCA GCA ACA ATC GAC ACA GAA GCG GGG ACC AGA CCG GGA GGA CGA CGC 
val phe pro ser ser ala thr ile asp thr glu ala gly thr arg pro gly gly arg arg 
183/61 213/71 

GGC CCG GGC CGC TTC GGG CCG AGT GTC TGA GTA AGA CCA GAG TCA CCG GTC CGT GTG TGA 
gly pro gly arg phe gly pro ser val OPA val arg pro glu ser arg val arg val OPA 
243/81 273/91 

CAA CCG CGC GGA ATT CAA TCG GAT GGC GGG CGG GAC GGG ATT GCG CCG GTC ACC GAG GAA 
gin pro arg gly lie gin ser asp gly gly arg asp arg lie ala pro val thr glu glu 
303/101 

CCT CCG GAG TGA TC 
pro pro glu OPA 



SEQ ID N° 12 
FIGURE 16C 



2767336 

37/73 

-lCl.96-Seq.20 -> 1- phase Translation 

DNA sequence 703 b.p. GGGATTTCGTTG ... CGCATGCGGATC linear 

1/1 31/11 

GGG ATT ICG TIG CCC GAT GGA TTG TTT GTA CGG TTT GGG AAA AAC ACT TGA ACT CCT TTT 
gly ile ser leu pro asp gly leu phe val arg phe gly lys aan thr OPA ser pro phe 
61/21 91/31 

TAT TGG CAA TGC TGG AAA TGG ACA TTC CAA TAT TGC GCG AAT TAA CCG AAC ACG GTG AGG 
tyr trp gin cys trp lys txp thr phe gin tyr cys ala asn OCH pro asn thr val arg 
121/41 151/51 

GGG GGG CAA GCG TTT GTA CCG GGG CCA GCA AGC GCC GCC GAC CGG TTG ACC GAA GCC AGC 
gly gly gin ala phe val pro gly pro ala ser ala ala asp arg leu thr glu ala ser 
181/^1 211/71 

ATG TTG TTG TGT CAG CGC GGG CTT GGT CTC GAT GTC CCG GCC TTG GCT GGA OCC GCT TCT 
met leu leu cys gin arg gly leu gly leu asp val pro ala leu ala gly pro ala ser 
24V81 271/91 

TCA AAA CAG GTT GAA CTT AAC GAC TCA AGA ACG GAA ACG CTT GAA CCG CGA CGT CGC TCC 
ser lys gin val glu leu asn asp ser arg thr glu thr leu glu pro arg arg arg ser 
301/101 331/111 

GGA CAC CAA TTT GAC TCG GCT CTT TGG CAA TTG AAG GTG AGC TGC GAG CAG CCG GGT GAC 
gly his gin phe asp ser ala leu trp gin leu lys val ser cys glu gin pro gly asp 
36V121 391/131 

CGC ATC GTT GGC CTT GCC ATC AAT CGC CGG CTC GCG GAC GTA GAT AAT CAG CTC AOC CTT 
arg lie val gly leu ala ile asn arg arg leu ala asp val asp asn gin leu thr val 
421/141 451/151 

GGG ACC GAC CTC GAC CAG GGG TCC TTT GTG ACT GCC GGG CTT GAC GCG GAC GAC CAC AGA 
gly thr asp leu asp gin gly ser phe val thr ala gly leu asp ala asp asp his arg 
481/161 511/171 

GTC GGT CAT CGC CTA AGG CTA CCG TTC TGA CCT GGG GCT GCG TGG GCG CCG ACG ACG TGA 
val gly his arg leu arg leu pro phe OPA pro gly ala ala trp ala pro thr thr OPA 
541/181 571/191 

GGC ACG TCA TGT CTC AGC GGC CCA CCG CCA OCT CGG TCG CCG GCA GTA TGT CAG CAT GTG 
gly thr ser cys leu ser gly pro pro pro pro arg ser pro ala val cys gin his val 
601/201 631/211 

CAG ATG ACT CCA CGC AGC CTT GTT CGC ATC GTT GGT GTC GTG GTT GCG ACG ACC TTG GCG 

gin met thr pro arg ser leu val arg lie val gly val val val ala thr thr leu ala 

661/221 691/231 

CTG GTG AGC GCA CCC GCC GGC GGT CGT GCC GCG CAT GCG GAT C 

leu val ser ala pro ala gly gly arg ala ala hLs ala asp 



SEQ ID N° 13 
FIGURE 17A 



2767336 

38/73 

-1CL96-Seq.20 [2 to 703] -> 1-ptaase Translation 

DNA sequence 703 b.p. GGGATTTCGTTG ... CGCATCCGGATC linear 

2/1 32/11 

GGA TTT CGT TGC CCG ATG GAT TGT TTG TAC GGT TTG GGA AAA ACA CTT GAA GTC CTT TTT 
gly phe arg cys pro met asp cys leu tyr gly leu gly lys thr leu glu val leu phe 
62/21 92/31 

ATT GGC AAT GCT GGA AAT GGA CAT TCC AAT ATT GCG CGA ATT AAC CGA ACA CGG TGA GGG 
ile gly asn ala gly asn gly his ser asn ile ala arg ile asn arg thr arq OPA alv 
122/41 152 /51 * Y 

GGG GGC AAG CGT TTG TAC CGG GGC CAG CAA GCG CCG CCG ACC GGT TGA CCG AAG CCA GCA 
gly gly lys arg leu tyr arg gly gin gin ala pro pro thr gly OPA pro lys pro ala 
182/61 212/71 

TGT TGT TGT GTC AGC GCG GGC TTG GTC TCG ATG TCC CGG CCT TGG CTG GAC CCG CTT CTT 
cys cys cys val ser ala gly leu val ser met ser arg pro tip leu asp pro leu leu 
242/81 272/91 

CAA AAC AGG TTG AAC TTA ACG ACT CAA GAA CGG AAA CGC TTG AAC CGC GAC GTC GCT CCG 
gin asn arg leu asn leu thr thr gin glu arg lys arg leu asn arg asp val ala pro 
302/101 332/111 

GAC ACC AAT TTG ACT CGG CTC TTT GGC AAT TGA AGG TGA GCT GCG AGC AGC CGG GTG ACC 
asp thr asn leu thr arg leu phe gly asn OPA arg OPA ala ala ser ser arg val thr 
362/121 392/131 

GCA TCG TTG GCC TTG CCA TCA ATC GCC GGC TCG CGG ACG TAG ATA ATC AGC TCA CCG TTG 
ala ser leu ala leu pro ser lie ala gly ser arg thr AMB lie ile ser ser pro leu 
422/141 452/151 

GGA CCG ACC TCG ACC AGG GGT CCT TTG TGA CTG CCG GGC TTG ACG CGG ACG ACC ACA GAG 
gly pro thr ser thr arg gly pro leu OPA leu pro gly leu thr arg thr thr thr qlu 
482/161 512/171 * 

TCG GTC ATC GCC TAA GGC TAC CGT TCT GAC CTG GGG CTG CGT GGG CGC CGA CGA CGT GAG 
ser val ile ala OCH gly tyr arg ser asp leu gly leu arg gly arg arg arg arg glu 
542/181 572/191 

GCA CGT CAT GTC TCA GCG GCC CAC CGC CAC CTC GGT CGC CGG CAG TAT GTC AGC ATG TGC 
ala arg his val ser ala ala his arg his leu gly arg arg gin tyr val ser met cys 
602/201 632/211 

AGA TGA CTC CAC GCA GCC TTG TTC GCA TCG TTG GTG TCG TGG TTG CGA CGA CCT TGG CGC 

arg OPA leu his ala ala leu phe ala ser leu val ser trp leu arg arg pro trp arg 

662/221 692/231 

TGG TGA GCG CAC CCG CCG GCG GTC GTG CCG CGC ATG CGG ATC 

trp OPA ala his pro pro ala val val pro arg met arg lie 



SEQ ID N° 13 
FIGURE 17B 



39/73 



2767336 



-lCl.96-Seq.20 [3 to 7031 -> 1-phase Translation 

DNA sequence 703 b.p. GGGATTTCGTTG ... CGCATGCGGATC linear 

3/1 33/11 

GAT TTC GTT GOC CGA TGG ATT GTT TGT ACG GTT TGG GAA AAA CAC TTG AAG TCC TTT TTA 
asp phe val ala arg trp ile val cys thr val trp glu lys his leu lys ser phe leu 
63/21 93 /31 

TTG GCA ATG CTG GAA ATG GAC ATT CCA ATA TTG CGC GAA TTA ACC GAA CAC GGT GAG GGG 
leu ala met leu glu met asp ile pro ile leu arg glu leu thr glu his gly glu gly 
123/41 153/51 

GGG GCA AGC GTT TGT ACC GGG GCC AGC AAG CGC CGC CGA CCG GTT GAC CGA AGC CAG CAT 
gly ala ser val cys thr gly ala ser lys arg arg arg pro val asp arg ser gin his 
183/61 213/71 

GTT GTT GIG TCA GCG OGG GCT TGG TCT CGA TGT CCC GGC CTT GGC TGG ACC CGC TTC TTC 
val val val ser ala arg ala trp ser arg cys pro gly leu gly trp thr arg phe phe 
243/81 273/91 

AAA ACA GGT TGA ACT TAA CGA CTC AAG AAC GGA AAC GCT TGA ACC GCG ACG TCG CTC CGG 
lys thr gly OPA thr OCH arg leu lys asn gly asn ala OPA thr ala thr ser leu arq 
303/101 333/111 

ACA CCA ATT TGA CTC GGC TCT TTG GCA ATT GAA GGT GAG CTG CGA GCA GCC GGG TGA CCG 
thr pro ile OPA leu gly ser leu ala ile glu gly glu leu arg ala ala gly OPA pro 
363/121 393/131 

CAT CGT TGG OCT TGC CAT CAA TCG CCG GCT CGC GGA CGT AGA TAA TCA GCT CAC GGT TGG 
his arg trp pro cys his gin ser pro ala arg gly arg arg OCH ser ala his arg trp 
423/141 453/151 

GAC CGA OCT CGA CCA GGG GTC CTT TGT GAC TGC CGG GCT TGA CGC GGA CGA CCA CAG AGT 
asp arg pro arg pro gly val leu cys asp cys arg ala OPA arg gly arg pro gin ser 
483/161 513/171 

CGG TCA TCG OCT AAG GCT ACC GTT CTG ACC TGG GGC TGC GTG GGC CCC GAC CAC GTG AGG 
arg ser ser pro lys ala thr val ieu thr trp gly cys val gly ala asp asp val ara 
543/181 573/191 

CAC GTC ATG TCT CAG CGG CCC ACC GCC ACC TCG GTC GCC GGC AGT ATG TCA GCA TGT GCA 
his val met ser gin arg pro thr ala thr ser val ala gly ser met ser ala cys ala 
603/201 633/211 

GAT GAC TCC ACG CAG CCT TGT TCG CAT CGT TGG TGT CGT GGT TGC GAC GAC CTT GGC GCT 

asp asp ser thr gin pro cys ser his arg trp cys arg gly cys asp asp leu gly ala 

663/221 693/231 

GGT GAG CGC ACC CGC CGG CGG TCG TGC CGC GCA TGC GGA TC 

gly glu arg thr arg arg arg ser cys arg ala cys gly 



SEQ ID N 4 13 
FIGURE 17C 



40/73 2767336 

5C7.95 -> 1-phase Translation 

DNA sequence 361 b.p. CCACCGGGGCTG ... TCTCACCAGATC linear 

VI 31/11 

OCA CCG GGG CTG GAG GGG CGA ATG TGC GCC GAA CGC OGT CGG CCA ACT TGG OCG CTG AGG 
pro pro gly leu glu gly arg met cys ala glu arg arg arg pro thr txp pro leu acq 
61/21 9X/31 

GCG GCT GAT CCC CIG GCC CGA GAG GGG GCA AGC CAA TAG CGG CTC CAT CGG GCT TTG CTG 
ala ala asp pro leu ala arg asp gly ala ser gin AMB arg leu his arg ala leu leu 
121/41 151/51 

GTA GOG GTT CGG CGG GAA O0G AGC GCC GAC GTT GTC GGT GCC CGG TGA TAT ATT GGG TCA 
val ala val arg arg glu pro ser ala asp val val gly ala arg OPA tyr ile gly ser 
181/61 211/71 

GAC GGG TAT GGC GGC GAC TGA GGT GAT CTG CGA CAC GCC GCC GCG GTG CTC GAG CCA GGC 
asp gly tyr gly gly asp OPA gly asp leu arg his ala ala ala val leu glu pro qiv 
24V81 271/91 ^ Y 

TTA CGA CCA GGG AAT TTC GAA AAT GTT ATT CAG AAC ATC TTG TAT CTC TTC CTC CGT GCC 
leu arg pro gly asn phe glu asn val ile gin asn ile leu tyr leu phe leu arg ala 
30V101 331/111 

ACC CCC TAG GTG TAG TGT TTT CGA GTA CCG GCA GAT CCC AGT TCA CCA GTC TCA CCA GAT 
thr pro AMB val AMB cys phe arg val pro ala asp pro ser ser pro val ser pro asp 



SEQ ID N° 14 
FIGURE 18A 



2767336 

41/73 

5C7.95 [2 to 361] -> 1-phasc Translation 

DNA sequence 361 b.p. CCAOCGGGGCTG ... TCTCACCAGATC linear 

2/ 1 32/li 

CAC OGG GGC TOG AGG GGC GAA TGT GCG CCG AAC GOC GTC GGC CAA CTT GGC OGC TGA GGG 
his arg gly trp arg gly glu cys ala pro asn ala val gly gin leu gly arg OPA qly 
62/21 92/31 

CGG CTG ATC CCC TGG CCC GAG ACG GGG CAA GCC AAT AGC GGC TCC ATC GGG CTT TGC TGG 
arg leu lie pro trp pro glu thr gly gin ala asn ser gly ser Lie gly leu cys trp 
122/41 152 /51 

TAG CGG TTC GGC GGG AAC CGA GCG CCG ACG TTG TCG GTG CCC GGT GAT ATA TTG GGT CAG 
AMB arg phe gly gly asn arg ala pro thr leu ser val pro gly asp He leu gly gin 
182/61 212/71 

ACG GGT ATG GCG GCG ACT GAG GTG ATC TGC GAC ACG COG CCG CGG TGC TCG AGC CAG GCT 
thr gly met ala ala thr glu val lie cys asp thr pro pro arg cys ser ser qln ala 
242/81 272/91 

TAC GAC CAG GGA ATT TCG AAA ATG TTA TTC AGA ACA TCT TGT ATC TCT TCC TCC GTG CCA 
tyr asp gin gly Ue ser lys met leu phe arg thr ser cys ile ser ser ser val pro 
302/101 332/111 

CCC CCT AGG TGT AGT GTT TTC GAG TAC CGG CAG ATC CCA GTT CAC CAG TCT CAC CAG ATC 
pro pro arg cys ser val phe glu tyr arg gin ile pro val his gin ser his gin ile 



SEQ ID N° 14 
FIGURE 18B 



42/73 



2767336 



5C7.95 (3 to 361 J -> 1-phase Translation 

DHA sequence 361 b.p. CCAOCGGGGCTG ... TCTCACCAGATC linear 



3/1 

ACC GGG GCT GGA GGG GCG AAT GTG CGC CGA 
thr gly ala gly gly ala asn val arg arg 
63/21 

GGC TGA TCC CCT GGC CCG AGA CGG GGC AAG 
gly OPA ser pro gly pro arg arg gly lys 
123/41 

AGC GGT TOG GCG GGA ACC GAG CGC CGA CGT 
ser gly ser ala gly thr glu arg arg arg 
183/61 

CGG GTA TGG CGG CGA CTG AGG TGA TCT GCG 
arg val trp arg arg leu arg OPA ser ala 
243/81 

ACG ACC AGG GAA TTT CGA AAA TGT TAT TCA 
thr thr arg glu phe arg lys cys tyr ser 
303/101 

CCC CTA GGT GTA GTG TTT ICG AGT ACC GGC 
pro leu gly val val phe ser ser thr gly 



33/11 

ACG CCG TOG GCC AAC TTG GCC GCT GAG GGC 
thr pro ser ala asn leu ala ala glu gly 
93/31 

OCA ATA GCG GCT CCA TCG GGC TTT GCT GGT 
pro lie ala ala pro ser gly phe ala gly 
153/51 

TGT CGG TGC CCG GTG ATA TAT TGG GTC AGA 
cys arg cys pro val lie tyr trp val arg 
213/71 

ACA CGC CGC CGC GCT GCT CGA GCC AGG CTT 
thr arg arg arg gly ala arg ala arg leu 
273/91 

GAA CAT CTT GTA TCT CTT CCT CCG TGC CAC 
glu his leu val ser leu pro pro cys his 
333/111 

AGA TCC CAG TTC ACC AGT CTC ACC AGA TC 
arg ser gin phe thr ser leu thr arg 



SEQ ID N° 14 
FIGURE 18C 



43/73 2767336 

6C8.95-Seq.19 -> 1-phase Translation 

DNA sequence 300 b.p. CAAGCCCGGCXG ... GATACGCGGTAC linear 

1/1 31/11 

CAA GCC GGG COG CGA CTG TTT GCC GTT TTG GGG CTC CTA CCA GAA CAC CAC CTG GCG GCC 
gin ala arg pro arg leu phe ala val leu gly leu leu pro glu his his leu a la ala 
61/21 91/31 

GCG CAC CAT GGT GTG CAC CAG TTG CGA TCG GTT CCT CCC GCG CGC GGG CGG CGA CGA CGT 
ala his his gly val his gin leu arg ser val pro pro ala arg gly arg arg arg arg 
121/41 151/51 

CGA TGC CCG CGC CCC GGC GGC GCA GCT GCG TAG CTC GAC CCG CTC GAC GAC GAC GGG GTC 
arg cys pro arg pro gly gly ala ala ala AMB leu asp pro val asp asp asp gly val 
181/61 211/71 

GGC GGA CCA GTC GGC GAT GTC GAG GCG ATG GCA ATA CAG CGC CTT GGT GCG CGG CCA CAC 
gly gly pro val gly asp val glu ala met ala lie gin arg leu gly ala arg pro his 
241/81 271/91 

GTC TGA GGT GGC GAA GAC CAG TCC CGC GCC CAC CGG CAG CCG GAT CCG GAT ACG CGG TAC 
val OPA gly gly glu asp gin ser arg ala his arg gin pro asp pro asp thr arg tyr 



SEQ ID N° 15 
FIGURE 19A 



44/73 



2767336 



6C8.95-Seq.19 [2 to 300J -> 1-phase Translation 

DNA sequence 300 b.p. CAAGCCCGGCCG ... GATACGCGGTAC linear 



2/1 
















32/11 








AAG CCC 


GGC 


CGC 


GAC 


TGT 


TTG 


CCG 


TTT TGG 


GGC TCC 


TAC CAG AAC ACC 


ACC 


TGG CGG CCG 


lys pro 


gly 


arg 


asp 


cys 


leu 


pro 


phe trp 


gly ser 


tyr gin asn thr 


thr 


trp arg pro 


62/21 
















92/31 








CGC ACC 


ATG 


GTG 


TGC 


ACC 


AGT 


TGC 


GAT CGG 


TPC CTC 


CCG CGC GCG GGC 


GGC 


GAC GAC GTC 


arg thr 


met 


val 


cys 


thr 


ser 


cys 


asp arg 


phe leu 


pro arg ala gly gly 


asp asp val 


122/41 
















152/51 








GAT GCC 


CGC 


GCC 


CCG 


GCG 


GCG 


CAG 


CTG CGT 


AGC TCG 


ACC CGG TCG ACG 


ACG 


ACG GGG TCG 


asp ala 


arg 


ala 


pro 


ala 


ala 


gin 


leu arg 


ser ser 


thr arg ser thr 


thr 


thr gly ser 


182/61 
















212/71 








GGG GAC 


CAG 


TOG 


GCG 


ATG 


TOG 


AGG 


CGA TGG 


CAA TAC 


AGC GCC TTG GTG 


CGC 


GGC CAC ACG 


ala asp 


gin 


ser 


ala 


met 


ser 


arg 


arg trp 


gin tyr 


ser ala leu val 


arg 


gly his thr 


242/81 
















272/91 








TCT GAG 


GTG 


GCG 


AAG 


ACC 


AGT 


CCC 


GCG CCC 


ACC GGC 


AGC CGG ATC CGG 


ATA 


CGC GGT AC 


ser glu 


val 


ala 


lys 


thr 


ser 


pro 


ala pro 


thr gly 


ser arg He arg 


He 


arg gly 



SEQ ID N° 15 
FIGURE 19B 



45/73 

6C8.95-Seq.19 (3 to 300] -> 1- phase Translation 



2767336 



DNA sequence 300 b.p. CAAGCCCGGCCG ... GATACGCGGTAC linear 



3/1 
















33/11 






AGC CCG 


GCC 


GCG 


ACT 


GTT 


TGC 


CGT TTT 


GGG 


GCT OCT 


ACC 


AGA ACA CCA CCT GGC GGC CGC 


ser pro 


aJLcl 


cU.cl 


4-hr* 


v<il 


cys 


arg phe 


gly 


ala pro 




arg thr pro pro gly gly arg 


63/21 
















93/31 




GCA CCA 


TGG 


TGT 


GCA 


CCA 


GTT 


GCG ATC 


GGT 


ICC TCC 


CGC 


GCG CGG GCG GCG ACG ACG TCG 


ala pro 


trp 


cys 


ala 


pro 


val 


ala ile 


gly 


ser ser 


arg 


ala arg ala ala thr thr ser 


123/41 
















153/51 






ATG CCC 


GCG 


CCC 


CGG 


CGG 


CGC 


AGC TGC 


GTA 


GCT CGA 


CCC 


GGT CGA CGA CGA CGG GGT CGG 


met pro 


ala 


pro 


arg 


arg 


arg 


ser cys 


val 


ala arg 


pro 


gly arg arg arg arg gly arg 


183/61 
















213/71 






CGG ACC 


AGT 


CGG 


CGA 


TGT 


CGA 


GGC GAT 


GGC 


AAT ACA 


GCG 


CCT TGG TGC GCG GCC ACA CGT 


arg thr 


ser 


arg 


arg 


cys 


arg 


gly asp 


gly 


asn thr 


ala 


pro trp cys ala ala thr arg 


243/81 
















273/91 






CTG AGG 


TGG 


CGA 


AGA 


CCA 


GTC 


CCG CGC 


CCA 


CCG GCA 


GCC 


GGA TCC GGA TAC GCG GTA C 


leu arg 


trp 


arg 


arg 


pro 


val 


pro arg 


pro 


pro ala 


ala 


gly ser gly tyr ala val 
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46/73 2767336 

DE5.strider -> 1-phase Translatioa 

DMA sequence 400 b.p. TGCGCATGCCGA ... CAGTTCGGGATC linear 

1/1 31/11 

TGC GCA TGC CGA CCA GTG TGG TTG GCC GGA GTT CGT TTG TTC GOG ATT GCC TCA ACG ATT 
cys ala cys arg pro val trp leu ala gly val arg leu phe ala ile ala ser thr ile 
61/21 91/31 

CGA TAT AAC CAC TCT AGT CAC ATC AAC CAC ACT CGT ACC ATC GAG CGT GTG CGT TCA TGC 
arg tyr asn his ser ser his ile asn his thr arg thr ile glu arg val gly ser cys 
121/41 151/51 

CAT GCA TTC GOG ACC GCG GGA GCC GGC GAA CCC GCC GCC ACA CAT AAT CCA GAT TGA GGA 
his ala phe ala thr ala gly ala gly glu pro gly ala thr his asn pro asp OPA gly 
18V61 211/71 

GAC TTC CGT GCC GAA CCG ACG CCG ACG CAA GCT TTC GAC AGC CAT GAG CGC GGT CGC CGC 
asp phe arg ala glu pro thr pro thr gin ala phe asp ser his glu arg gly arg arg 
241/81 271/91 

OCT GGC AGT TGC AAG TCC TTG TGC ATA TTT TCT TGT CTA CGA ATC AAC CGA AAC GAC CGA 
Pro gly ser cys lys ser leu cys ile phe ser cys leu arg lie asn arg asn asp arg 
30V1O1 331/111 

GCG GCC CGA GCA CCA TGA ATT CAA GCA GGC GGC GGT GTT GAC CGA CCT GCC OGG CGA GCT 

ala ala arg ala pro OPA ile gin ala gly gly gly val asp arg pro ala arg arg ala 

36V121 391/131 

GAT GTC CGC GCT ATC GCA GGG GTT CTC CCA GTT CGG GAT C 

asp val arg ala ile ala gly val val pro val arg asp 



SEQ ID N° 16 
FIGURE 20A 



47/73 2767336 

DE5.strider [2 to 400] -> 1-phase Translation 

DNA sequence 400 b.p. TGCGCATGCCGA ... CAGTTCGGGATC linear 

VI 32/11 

GCG CAT GCC GAC CAG TGT GGT TGG CCG GAG TTC GTT TGT TCG CGA TTG CCT CAA CGA TTC 
ala his ala asp gin cys gly trp pro glu phe val cys ser arg leu pro gin arg phe 
62/21 92/31 

GAT ATA ACC ACT CTA GTC ACA TCA ACC ACA CTC GTA CCA TCG AGC GTG TGG GTT CAT GCC 
asp lie thr thr leu val thr ser thr thr leu val pro ser ser val trp val his ala 
122/41 152 /5l 

ATG CAT TCG CGA CCG CGG GAG CCG GCG AAC CCG GCG CCA CAC ATA ATC CAG ATT GAG GAG 
met his ser arg pro arg glu pro ala asn pro ala pro hLs tie ile gin ile qlu alu 
182/61 212/71 ^ 

ACT TOC GTG CCG AAC CGA OGC CGA CGC AAG CTT TOG ACA GCC ATC ACC GCG GTC GCC GCC 
thr ser val pro asn arg arg arg arg lys leu ser thr ala met ser ala val ala ala 
242/81 272/91 

CTG GCA GTT GCA AGT CCT TGT GCA TAT TTT CTT GTC TAC GAA TCA ACC GAA ACC ACC GAG 
leu ala val ala ser pro cys ala tyr phe leu val tyr glu ser thr glu thr thr qlu 
302/101 332/111 

OGG GCC GAG CAC CAT GAA TTC AAG CAG GCG GCG GTG TTG ACC GAC CTG CCC GGC GAG CTG 
arg pro glu his his glu phe lys gin ala ala val leu thr asp leu pro gly glu leu 
362/121 392/131 
ATG TCC GCG CTA TOG CAG GGG TTG TOC CAG TTC GGG ATC 
met ser ala leu ser gin gly leu ser gin phe gly ile 



SEQ ID N° 16 
FIGURE 20B 



48/73 2767336 

DE5.strider [3 to 400] -> 1-phase Translation 

DNA sequence 400 b.p. TGCGCATGCCGA ... CAGTTCGGGATC linear 

VI 33/11 

CGC ATG CCG ACC AGT GTG GTT GGC CGG AGT TOG TTT GTT CGC GAT TGC CTC AAC GAT TCG 
arg met pro thr ser val val gly arg ser ser phe val arg asp cys leu asn asp ser 
63/21 93/3 x 

ATA TAA CCA CTC TAG TCA CAT CAA CCA CAC TOG TAC CAT CGA GOG TGT GGG TTC ATG CCA 
lie OCH pro leu AMB ser his gin pro his ser tyr his arg ala cys gly phe met pro 
123/41 153/51 

TGC ATT CGC GAG CGC GGG AGC CGG CGA ACC CGG CGC CAC ACA TAA TCC AGA TTG AGG AGA 
cys lie arg asp arg gly ser arg arg thr arg arg his thr OCH ser arg leu arg arg 
183/61 213/71 

CTT CCG TGC CGA ACC GAC GCC GAC GCA AGC TTT CGA CAG CCA TGA GCG CGG TCG CCG CCC 
leu pro cys arg thr asp ala asp ala ser phe arg gin pro OPA ala arg ser pro pro 
243/81 273/91 

TGG CAG TTG CAA GTC CTT GTG CAT ATT TTC TTG TCT ACG AAT CAA CCG AAA CGA CCG AGC 
trp gin leu gin val leu val his lie phe leu ser thr asn gin pro lys arg pro ser 
303/101 333/111 

GGC CCG AGC AOC ATG AAT TCA AGC AGG CGG CGG TGT TGA CCG ACC TGC CCG GCG AGC TGA 
gly pro ser thr met asn ser ser arg arg arg cys OPA pro thr cys pro ala ser OPA 
363/121 393/131 
TGT CCG CGC TAT CGC AGG GGT TGT COC AGT TCG GGA TC 
cys pro arg tyr arg arg gly cys pro ser ser gly 



SEQ ID N° 16 
FIGURE 20C 



2767336 

49/73 

DE8.strider -> 1-phasc Translation 

DNA sequence 359 b.p. GCGGGCCAGCGA ... CTCGGGCTGATC linear 



1/1 31/11 

GCG GGC CAC CGA TCA GTC GAT CGG GTG GTT TCC GCT CCA TCA GCC CGG AAT TGA GGT GCC 
ala gly his arg ser val asp arg val val ser ala pro ser a la arg asn OPA gly ala 
61/21 91/31 

GCA GTG ACG ACA CCA GCG CAG GAC GCG CCG TTG GTG TTT CCC TCT GTT GCT TTC COG TCC 
ala val thr thr pro ala gin asp ala pro leu val phe pro ser val ala phe pro ser 
121/41 151/51 

GGC TOG GCT TTT TTT CAT CAA CGT TGG ACT GCC GCA GTG GCG ATG TTG GTC GCC GGC GTG 
gly ser pro phe phe his gin arg trp thr ala ala val ala met leu val ala gly val 
181/61 211/71 

TTC GGT CAC CTG ACG GTC GGG ATG TTC CTT GGG TCT CGG GTT GCT GCT GGG TTT GCT CAA 
phe gly his leu thr val gly met phe leu gly ser arg val ala ala gly phe ala gin 
241/81 271/91 

TGC CCT GCT GGT GCG GCG TTC GGC CGA GTC GAT CAC CGC CAA AGA GCA CCC GTT AAA ACG 
cys pro ala gly ala ala phe gly arg val asp his arg gin arg ala pro val lys thr 
301/101 331/111 

GTC GAT GGC CCT CAA CTC GGC ATC GCG ACT GGC GAT TAT CAC CAT GCC TCG GGC TGA TC 
val asp gly pro gin leu gly ile ala thr gly asp tyr his his ala ser gly OPA 



SEQ. ID N° 17 
FIGURE 21 A 



50/73 



2767336 



DE8.strider [2 to 359) -> I-phase Translation 



DKA sequence 


359 


b. 


r * 


GCGGGCCACCGA ... CTOGGGCTGATC 


linear 






2/1 














32/11 


















TCG 


ATC 


GGG 


TGG TTT 


CCG CTC CAT CAG COC 


GGA 


ATT 


GAG 


GTG 


CCG 


arg ala 


Oix 


asp gin 




ile 


gly 


trp phe 


pro leu his gin pro 


giy 


ile 


glu 


val 


pro 


oz/zx 














yz/3i 










GAG luA 




UAL* UiVj 


CGC 


AGG 


ACG 


CGC CGT 


TCG TGT TTC CCT CTG 


TTG 


CTT 


TCC 


CGT 


CCG 


gin OPA 


arg 


nis gin 


arg 


arg 


thr 


arg arg 


trp cys phe pro leu 


ieu 


leu 


ser 


arg 


pro 


122/41 














152/51 










GCT CGC 


CTT 


TTT TTC 






GTT 


GGA CTG 


CCG CAG TGG CGA TGT 


TGG 


TCG 


CCG 


GCG 


TGT 


ala arg 


leu 


phe phe 


lie 


asn 


val 


gly leu 


pro gin trp arg cys 


trp 


ser 


pro 


ala 


cys 


182/61 














212/71 












TCG GTC 


ACC 


TGA CGG 


TCG 


GGA 


TGT 


TCC TTG 


GGT CTC GGG TTG CTG 


CTG 


GGT 


TTG 


CTC 


AAT 


ser val 


thr 


OPA arg 


ser 


gly 


cys 


ser leu 


gly leu gly leu leu 


leu 


gly 


leu 


leu 


asn 


242/81 














272/91 












GCC CTG 


CTG 


GTG CGG 


CGT 


TCG 


GCC 


GAG TOG 


ATC ACC GCC AAA GAG 


CAC 


CCG 


TTA 


AAA 


CGG 


ala leu 


leu 


val arg 


arg 


ser 


ala 


glu ser 


lie thr ala ly3 glu 


his 


pro 


leu 


lys 


arg 


302/101 














332/111 








TCG ATG 


GCC 


CTC AAC 


TCG 


GCA 


TCG 


CGA CTG 


GCG ATT ATC ACC ATG 


CCT 


CGG 


GCT 


GAT 


C 


sec met 


ala 


leu asn 


ser 


ala 


ser 


arg leu 


ala ile lie thr met 


pro 


arg 


ala 


asp 





SEQ ID N° 17 
FIGURE 21 B 



51/73 



2767336 



DE8-strider [3 to 359] -> 1-phase Translation 

DNA sequence 359 b.p. GCGGGCCACCGA ... CTOGGGCTGATC linear 



3/1 
















33/11 






GGG CCA 


CCG 


ATC 


AGT CGA 


TCG 


GGT 


GGT 


TTC 


CGC TCC 


ATC AGC CCG GAA TTG AGG TGC 


CGC 


gly pro 


pro 


ile 


ser arg 


ser 


gly gly 


phe 


arg ser 


ile ser pro glu leu arg cys 


arg 


63/21 
















93/31 


AGT GAC 


GAC 


ACC 


AGC GCA 


GGA 


CGC 


GCC 


GTT 


GGT GTT 


TCC CTC TGT TGC TTT CCC GTC 


CGG 


ser asp 


asp 


thr 


ser ala 


gly 


arg 


ala 


val 


gly val 


ser leu cys cys phe pro val 


arg 


123/41 
















153/51 




CTC GCC 


TTT 


TTT 


TCA TCA 


ACG 


TTG 


GAC 


TGC 


OGC AGT 


GGC GAT GTT GGT CGC CGG CGT GTT 


leu ala 


phe 


phe 


ser ser 


thr 


leu 


asp 


cys 


arg ser 


gly asp val gly arg arg arg 


val 


183/61 
















213/71 






CGG TCA 


OCT 


GAC 


GGT CGG 


GAT 


GTT CCT 


TGG 


GTC TCG 


GGT TGC TGC TGG GTT TGC TCA 


ATC 


arg ser 


pro 


asp 


gly arg 


asp 


val 


pro 


trp 


val ser 


gly cys cys trp val cys ser 


met 


243/81 
















273/91 






CCC TGC 


TGG 


TGC 


GGC GTT 


CGG 


CCG 


AGT 


CGA 


TCA CCG 


CCA AAG AGC ACC CGT TAA AAC GGT 


pro cys 


trp 


cys 


gly val 


arg 


pro 


ser 


arg 


ser pro 


pro lys ser thr arg OCH asn 


gly 


303/101 
















333/111 




CGA TGG 


CCC 


TCA 


ACT CGG 


CAT 


CGC 


GAC 


TGG 


CGA TTA 


TCA CCA TGC CTC GGG CTG ATC 




arg trp 


pro 


ser 


thr arg 


his 


arg 


asp 


trp 


arg leu 


ser pro cys leu gly leu lie 





SEQ ID N° 17 
FIGURE 21 C 



2767336 

52/73 

DE10.strider -> 1-phase Translation 

DNA sequence 390 b.p. GTCGAACAGGTA ... GGTGCGATGATC linear 

VI 31/11 

GTC GAA CAG GTA CGG AAG GCG CCG TCG GTC GCT CGG TCC GCT GGT ATC TCG TGT TCA GCC 
val glu gin val arg lys ala pro ser val ala arg ser ala gly ile ser cys ser ala 
61/21 91/31 

AGC CAG CGG CCG TTA ACG TGG CCG AAC AGG TCG TCT TGG GGT CGG GCA TCA GCG TOG ATG 
ser gin arg pro leu thr txp pro asn arg ser ser trp gly arg ala ser ala ser met 
121/41 151/51 

TGG CTC AGG TOG ATA CCC GAG GGG ATG GCA AGT GTC ACC CCG CCA TCC TTC CAC CTC TTT 
trp leu arg ser lie pro glu gly met ala ser val thr pro pro ser phe his leu phe 
181/61 211/71 

TCG GGT GCA ACG ATC GGG CCA TGC CTG ACG GGG AGC AGA GCC AGC CAC CGG OCC AAG AAG 
ser gly ala thr ile gly pro cys leu thr gly ser arg ala ser his arg pro lys lys 
241/81 271/91 

ATG CGG AAG AOG ACT CGC GGC CCG ACG CCG CGG AGG CCG CCG CGG CCG AAC OCA AAT CAT 
met arg lys thr thr arg gly pro thr pro arg arg pro pro arg pro asn pro asn his 
301/101 331/111 

CAG CCG GTC COG ATG TTC TCG ACC TAC GGT ATC GCC TCG ACA CTA CTC GGC GTC CTA TCG 
gin pro val pro met phe ser thr tyr gly ile ala ser thr leu leu gly val leu ser 
361/121 

GTC GCC GCG GTC GTG CTG GGT GCG ATG ATC 
val ala ala val val leu gly ala met ile 



SEQ ID N° 18 
FIGURE 22A 



53/73 

DElO.strider (2 to 390J -> 1-phase Translation 



2767336 



DNA sequence 390 b.p. GTCGAACAGGTA ... GGTCCGATGATC linear 



2/1 








J*/ A. J. 














TCG AAC 


AGG 


TAC 


cr-h ncc nrr* cnr mn tttz 


CTC GGT CCG 


I* J.\> GTA 


TCT 


CGT 


GTT 


CAG 


CCA 


car ncn 
OCX. aoii 


arg 


uyr 


rt 1 V A m m a m J* r*n c a r* 
yj-j Qi. y CLL y Gi. y olQ £»c=L7 


leu gly pro 


leu val 


ser 


arg 


val 


gin 


pro 
























m» » rv**P fW fCti An* /V*»r» 
1AA UjL IAjL. VAsA iuJA UVj 1 


CGT CTT GGG 


GTC GGG 


CAT 


CAG 


CGT 


CGA 


TGT 


ala ser 


gly 


arg 


OCH arg gly arg thr gly 


arg leu gly 


val gly 


his 


gin 


arg 


arg 


cys 


122/41 








152/51 










GGC TCA 


GGT 


CGA 


TAC CCG AGG GGA TGG CAA 


GTG TCA CCC 


CGC CAT 


CCT 


TCC 


ACC 


TCT 


TTT 


gly ser 


gly 


arg 


tyr pro arg gly trp gin 


val ser pro 


arg his 


pro 


ser 


thr 


ser 


phe 


182/61 








212/71 












CGG GTG 


CAA 


CGA 


TCG GGC CAT GCC TGA CGG 


GGA GCA GAG 


CCA GCC 


ACC 


GGC 


CCA 


AGA 


AGA 


arg val 


gin 


arg 


ser gly his ala OPA arg 


gly ala glu 


pro ala 


thr 


gly 


pro 


arg 


arg 


242/81 








272/91 










TGC GGA 


AGA 


CGA 


CTC GCG GCC CGA CGC CGC 


GGA GGC CGC 


CGC GGC 


CGA 


ACC 


CAA 


ATC 


ATC 


cys gly 


arg 


arg 


leu ala ala arg arg arg 


gly gly arg 


arg gly 


arg 


thr 


gin 


lie 


lie 


302/101 








332/111 














AGC CGG 


TCC 


CGA 


TGT TCT CGA CCT ACG GTA 


TCG CCT CGA 


CAC TAC 


TCG 


GCG 


TGC 


TAT 


CGG 


ser arg 


ser 


arg 


cys ser arg pro thr val 


ser pro arg 


his tyr 


ser 


ala 


cys 


tyr 


arg 


362/121 
















TOG CCG 


CGG 


TCG 


TGC TGG GTG CGA TGA TC 
















ser pro 


arg 


ser 


cys trp val arg OPA 

















SEQ ID N° 18 
FIGURE 22B 



54/73 2767336 

DE10.strider [3 to 390] -> 1-phase Translation 

DNA sequence 390 b.p. GTCGAACAGGTA ... GGTGCGATGATC linear 

VI 33/11 

CGA ACA GGT ACG GAA GGC GCC GTC GGT CGC TOG GTC CGC TGG TAT CTC GTG TTC AGC CAG 

917 ^ 9lU 9lY 913 Val * ly ar 9 « val ar 9 trp tyr leu val phe ser qln 
63/21 93/3! 

CCA GCG GCC GTT AAC GTG GCC GAA CAG GTC GTC TTG GGG TCG GGC ATC AGC GTC GAT GTG 
pro ala ala val asn val ala glu gin val val leu gly ser gly lie ser val asp val 
123/41 153/51 

GCT CAG GTC GAT ACC CGA GGG GAT GGC AAG TGT CAC CCC GCC ATC CTT CCA OCT CTT TTC 

iJ D Val aSP thr arg 9ly asp gly lys hls P ro ala Ue Pro pro leu phe 
183/61 213/71 

GGG TGC AAC GAT CGG GCC ATG CCT GAC GGG GAG CAG AGC CAG CCA COG GCC CAA GAA GAT 
gly cys asn asp arg ala met pro asp gly glu gin ser gin pro pro ala gin glu asp 
243/81 273/91 
GTCGAAGACGACTTCCGGrcCGACC^GrcC^ 

ala glu asp asp ser arg pro asp ala ala glu ala ala ala ala glu pro lys ser ser 
303/101 333/111 

GCC GGT CCC GAT GTT CTC GAC CTA CGG TAT OGC CTC GAC ACT ACT CGG CGT GCT ATC GGT 

363/121 ^ arg ^ aCg arg ala Ue 

CGC CGC GGT OGT GCT GGG TGC GAT GAT C 
arg arg gly arg ala gly cys asp asp 



SEQ ID N° 18 
FIGURE Z2C 



2767336 

55/73 

DE14.strider -> 1-phase Translation 

DNA sequence 380 b.p. GTTGCGCAACGG ... TGCTGGTAGATC linear 



1/1 














31/11 
















GTT GCG 


CAA 


OGG 


GGT GAG 


CAC 


CGA CGC 


GAT 


GAT GGC 


GCA 


ACT AtC 


GAA 


ACT 


GCA 


GGA 


CAT 


val ala 


oln 


ara 


alv alu 


his 


ara ara 


aso 


asD alv 


ala 


thr lie 


glu 


thr 


ala 


alv 


hi3 


61/21 














91/31 
























CAC 


TCG CGC 


CCIT 


GGG CAC 


CCC 


TGG CTA 


TCA 


GGC 


CAG 


CGT 




arg gin 


arg 


gin 


arg arg 


his 


ser arg 


n 1 v 
gxy 


gly his 


pro 


trp leu 


ser 


alv 


gin 


arg 


arg 


121/41 














151/51 




















AAA 
nnn 


par* at*T 


cm 


CAA CAG 




TT*P TY^A 
1X1 lun 


TGT 


GCA AAC 


CCC 


GGA 


vl t 


_„ 




leu cys 


alv 


Ivs 


his thr 


ala 


gin gin 


ara 


phe OPA 


cys 


ala asn 


pro 


gly 


val 


leu 


ara 


181/61 














211/71 
















TCG CGT 


GTT 


CAA 


GGC CGA 


AAA 


AGG GGT 


GGT 


GAC CCT 


CGG 


CGG CAA 


CAC 


CGT 


GGA 


GGC 


GAG 


ser arg 


val 


gin 


gly arg 


lys 


arg gly 


gly 


asp pro 


arg 


arg gin 


his 


arg 


gly 


gly 


glu 


241/81 














271/91 
















GGC GCT 


OGA 


GTA 


CAG CCT 


CGG 


CAC ACC 


GCC 


GGA CGG 


GGT 


GAC GGG 


CCC 


GCT 


GGT 


GGC 


TGC 


gly a la 


arg 


val 


gin pro 


arg 


his thr 


ala 


gly arg 


gly 


asp gly 


pro 


ala 


gly 


gly 


cys 


301/101 














331/111 
















CCC CGC 


OGA 


CGA 


CAG TCC 


GGG 


CTG CAG 


TCC 


GTC GGA 


CTA 


CGA CAG 


GCT 


GCC 


GGT 


GTC 


CGG 


pro arg 


arg 


arg 


gin ser 


gly 


leu gin 


ser 


val gly 


leu 


arg gin 


ala 


ala 


gly 


val 


arg 


361/121 






























TGC GGT 


GGT 


GCT 


GGT AGA 


TC 






















cys gly 


gly 


a la 


gly arg 

























SEQ ID N° 19 
FIGURE 23A 



2767336 

56/73 

DE14,strider [2 to 380] -> I-phase Translation 

DNA sequence 380 b.p. GTTGCGCAACGG ... TGCTGGTAGATC linear 

2/1 32/11 

TTG CGC AAC GGG GTG AGC ACC GAC GCG ATG ATG GOG CAA CTA TOG AAA CTG CAG GAC ATC 
leu arg asn gly val ser thr asp ala met met ala gin leu ser lys leu gin asp lie 
62/21 92/31 

GCC AAC GCC AAC GAC GGC ACT CGC GCG GTG GGC ACC CCT GGC TAT CAG GCC AGC GTC GAC 
ala asn ala asn asp gly thr arg ala val gly thr pro gly tyr gin ala ser val asp 
122/41 152/51 

TAT GTG GTA AAC ACA CTG OGC AAC AGC GGT TTT GAT GTG CAA ACC CCG GAG TTC TCC GCT 
tyr val val asn thr leu arg asn ser gly phe asp val gin thr pro glu phe ser ala 
182/61 212/71 

CGC GTG TIC AAG GCC GAA AAA GGG GTG GTG ACC CTC GGC GGC AAC ACC GTG GAG GOG AGG 
arg val phe lys ala glu lys gly val val thr leu gly gly asn thr val glu ala arq 
242/81 272/91 

GCG CTC GAG TAC AGC CTC GGC ACA CCG CCG GAC GGG GTG ACG GGC CCG CTG GTG GCT GCC 
ala leu glu tyr ser leu gly thr pro pro asp gly val thr gly pro leu val ala ala 
302/101 332/111 

CCC GCC GAC GAC AGT CCG GGC TGC AGT CCG TCG GAC TAC GAC AGG CTG CCG GTG TCC GGT 
pro ala asp asp ser pro gly cys ser pro ser asp tyr asp arg leu pro val ser gly 
362/121 

GCG GTG GTG CTG GTA GAT C 
ala val val leu val asp 



SEQ ID N° 19 
FIGURE 23B 



57/73 2767336 

DEM.strider (3 to 3S0] -> 1- phase Translation 

DNA sequence 380 b.p. GTTGCGCAACGG . .. TGCTGGTAGATC linear 

3/1 33/11 

TGC GCA ACG GGG TGA GCA OCG ACG CGA TGA TGG CGC AAC TAT CGA AAC TGC AGG ACA TCG 
cys ala thr gly OPA ala pro thr arg OPA trp arg asn tyr arg asn cys arg thr ser 
63/21 93/31 

CCA ACG CCA AGG ACG GCA CTC GCG CGG TGG GCA CCC CTG GCT ATC AGG CCA GCG TCG ACT 
pro thr pro thr thr ala leu ala arg trp ala pro leu ala ile arg pro ala ser thr 
123/41 153/51 

ATG TGG TAA ACA CAC TGC GCA ACA GCG GTT TTG ATG TGC AAA COC CGG AGT TCT CCG CTC 
met trp OCH thr his cys ala thr ala val leu met cys lys pro arg ser ser pro leu 
183/61 213/71 

GCG TGT TCA AGG CCG AAA AAG GGG TGG TGA CCC TCG GCG GCA ACA CCG TGG AGG CGA GGG 
ala cys ser arg pro lys lys gly trp OPA pro ser ala ala thr pro trp arg arg gly 
243/81 273/91 

CGC TCG AGT ACA GCC TCG GCA CAC CGC CGG ACG GGG TGA CGG GCC CGC TGG TGG CTG CCC 
arg ser ser thr ala ser ala his arg arg thr gly OPA arg ala arg trp trp leu pro 
303/101 333/111 

CCG CCG ACG ACA GTC CGG GCT GCA GTC CGT CGG ACT ACG ACA GGC TGC CGG TGT CCG GTG 
pro pro thr thr val arg ala ala val arg arg thr thr thr gly cys arg cys pro val 
363/121 

CGG TGG TGC TGG TAG ATC 
arg trp cys trp AMB ile 



SE0_ ID N" 19 
FIGURE 23C 



2767336 

58/73 

DEl5.strider -> 1-phase Translation 

DNA sequence 390 b.p. CGAGACAGTGGT ... TGCATCAGGATC linear 

VI 31/11 

CGA GAC AGT GGT GCG GGA CAC TTG AGT TCG GCT GCT AAC GAC GCC AGA GTC GCC CGC TTC 
arg asp ser gly ala gly his leu ser ser ala aia asn asp ala arg val ala arg phe 
61/21 91/31 

CGC GGT GTG GGA CTC ACG TTC GGT GAG GGT ACA GCG GAC CTT OGA GCA OGC AAT ATC GIG 
arg gly val gly leu thr phe gly glu gly thr ala asp leu arg ala arg asn He val 
121/41 151/51 

GGC CGG CTG GCA ACC GTC GGT TTC GAC GTT GGT GAC GAC CCC TOG TTC ATG AAT CGT TCT 
gly arg leu ala thr val gly phe asp val gly asp asp pro ser phe met asn arg ser 
181/61 211/71 

TGA GCT CCC CGT TTT GCT GGA TGC CCA GGC AOC GCC GGT ACT GCT GCG CTT AAG CTT GTC 
OPA ala pro arg phe ala gly cys pro gly thr ala gly thr ala ala leu lys leu val 
241/81 271/91 

GCA CAT GGT GCC GGC AGG GAG GAA CAG TGG GCA AGC AGC TAG CCG CGC TCG CCG CGC TCG 
ala his gly ala gly arg glu glu gin trp ala ser ser AMB pro arg ser pro arg trp 
301/101 331/111 

TCG GTG CGT GCA TGC TCG CAG CCG GAT GCA CCA ACG TGG TCG AOG GGA CCG CCG TGG CTG 
ser val arg ala cys ser gin pro asp ala pro thr trp ser thr gly pro pro trp leu 
361/121 

CCG ACA AAT CCG GAC CAC TGC ATC AGG ATC 
pro thr asn pro asp his cys He arg He 



SEQ ID N° 20 
FIGURE 24A 



59/73 2767336 

DE15.strider [2 to 390] -> 1-phase Translation 

DNA sequence 390 b.p. CGAGACAGTGGT ... TGCATCAGGATC linear 

2/1 32/11 

GAG ACA GTG GTG CGG GAC ACT TGA GTT CGG CTG CTA ACG ACG CCA GAG TCG CCC GCT TCC 
glu thr val val arg asp thr OPA val arg leu leu thr thr pro glu ser pro ala ser 
62/21 92/31 

GCG GTG TGG GAC TCA CGT TCG GTG AGG GTA CAG CGG ACC TTC GAG CAC GCA ATA TCG TGG 
ala val trp asp ser arg ser val arg val gin arg thr phe glu his ala ile ser tru 
122/41 JL52/51 F 

GCC GGC TGG CAA CCG TCG GTT TCG ACG TTG GTG ACG ACC CCT CGT TCA TGA ATC GTT CTT 
ala gly trp gin pro ser val ser thr leu val thr thr pro arg ser OPA lie val leu 
182/61 212/71 

GAG CTC OCC GTT TTG CTG GAT GCC CAG GCA CCG CCG GTA CTG CTG CGC TTA ACC TTG TCG 
glu leu pro val leu leu asp ala gin ala pro pro val leu leu arg leu ser leu ser 
242/81 272/91 

CAC ATG GTG CCG- GCA GGG AGG AAC AGT GGG CAA GCA GCT AGC CGC GCT CGC CGC GCT GGT 
his met val pro ala gly arg asn ser gly gin ala ala ser arg ala arg arg ala qlv 
302/101 332/111 

CGG TGC GTG CAT GCT CGC AGC CGG ATG CAC CAA CGT GGT CGA CCG GAC CGC CGT GGC TCC 
arg cys val his ala arg ser arg met his gin arg gly arg arg asp arg arg gly cys 
362/121 

CGA CAA ATC CGG ACC ACT GCA TCA GGA TC 
arg gin ile arg thr thr ala ser gly 



SEQ ID N° 20 



FIGURE 24B 



2767336 

60/73 

DElS^trider [3 to 390] -> l-phase Translation 

DNA sequence 390 b.p. CGAGACAGTGGT ... TGCATCAGGATC linear 

3/1 33/11 

AGA CAG TGG TGC GGG ACA CTT GAG TTC GGC TGC TAA CGA CGC CAG AGT CGC CCG CTT CCG 
arg gin trp cys gly thr leu glu phe gly cys OCH arg arg gin ser arg pro leu pro 
63/21 93/31 

GGG TGT GGG ACT CAC GTT CGG TGA GGG TAG AGC GGA CCT TCG AGO ACG CAA TAT CGT GGG 
arg cys gly thr his val arg OPA gly tyr ser gly pro ser ser thr gin tyr arg gly 
123/41 153/51 

CCG GCT GGC AAC CGT CGG TTT CGA CGT TGG TGA CGA CCC CTC GTT CAT GAA TCG TTC TTC 
pro ala gly asn arg arg phe arg arg trp OPA arg pro leu val his glu ser phe leu 
183/61 213/71 

AGC TCC CCG TTT TGC TGG ATG CCC AGG CAC CGC CGG TAC TGC TGC GCT TAA GCT TGT CGC 
ser ser pro phe cys trp met pro arg his arg arg tyr cys cys ala OCH ala cys arg 
243/81 273/91 

ACA TGG TGC CGG CAG GGA GGA ACA GTG GGC AAG CAG CTA GCC GGG CTC GCC CCG CTG GTC 
thr trp cys arg gin gly gly thr val gly lys gin leu ala ala leu ala ala leu val 
303/101 333/111 

GGT GCG TGC ATG CTC GCA GCC GGA TGC ACC AAC GTG GTC GAC GGG ACC GCC GTG GCT GCC 
gly ala cys met leu ala ala gly cys thr asn val val asp gly thr ala val ala ala 
363/121 

GAC AAA TCC GGA CCA CTG CAT CAG GAT C 
asp lys ser gly pro leu his gin asp 



SEQ ID N° 20 



FIGURE 24C 



61/73 



2767336 



DE16.strider -> 1-phase Translation 

DNA sequence 390 b.p. GTCCTGGTCGCC ... GCTTGCGGGATC linear 



1/1 31/11 

GTC CTG GTC GCC GCG CAA CTG GCC GGT CCC GAT GGA AAG TGT TCA CGA TCG CGC TTC TGC 
val leu val ala ala gin leu ala gly pro asp gly lys cys ser arg ser arg phe cys 
61/21 91/31 

CGC TGG TAG TGG CGA TGG TGT TAG CAG GAT TGC GGG TCG AGG CTG CGA TGG CCA GCA CCA 
arg txp AMB txp arg trp cys AMB gin asp cys gly ser arg leu arg trp pro ala pro 
121/41 151/51 

GCG GCC TGC GGC TGG TCG CCG CGC GCG CCG AAA TGA TAG CCG CGA TCA CGA AAT ACA TGT 
ala ala cys gly trp ser pro arg ala pro lys OPA tyr pro arg ser arg asn thr cys 
181/61 211/71 

CGG CGC TGG ACG TCG CCG TGC TGG CCA GCT CGA CCG GAC ACG ATG TGG AGG GGG CGC AGA 
arg arg txp thr ser pro cys trp pro ala arg pro asp thr met trp arg gly arg arg 
241/81 271/91 

AAA ACT TCA COG CCC GCA AGT ACG AGC TGC AGA CGC GAC TGG COG ACA CCG ACG TCA TCG 
lys thr ser pro pro ala ser thr ser cys arg arg asp trp pro thr pro thr ser ser 
301/101 331/111 

CAG ACG TGC GGT CGG GAG TGA ACA CGC TGC TCA ACG GCG GTC AGG CGC TGC TGG ATA AGA 
gin thr cys gly arg glu OPA thr arg cys ser thr ala val arg arg cys trp lie arg 
361/121 

TGC TGG CCG ACA GCA TCG GCT TGC GGG ATC 
cys trp pro thr ala ser ala cys gly He 



SEQ ID N° 21 



FIGURE 25A 



62/73 

DE16.strider [2 to 390] -> 1-phase Translation 



2767336 



DNA sequence 390 b.p. GTCCTGGTOGCC ... GCTTGCGGGATC linear 



2/1 










32/11 
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val arg ala 


ala 
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SEQ. ID N° 21 



FIGURE 25B 



2767336 

63/73 

DEl6.$trider [3 to 390] -> 1-phase Translation 

DNA sequence 390 b.p. GTCCTGGTCGCC ... GCTTGCGGGATC linear 

VI 33/11 

CCT GGT OGC CGC GCA ACT GGC CGG TCC CGA TGG AAA GTG TTC AOG ATC GCG CTT CTG CCG 
pro gly arg arg ala thr gly arg ser arg trp lys val phe thr ile ala leu leu pro 
63/21 93/31 

CTG GTA GTG GOG ATG GTG TTA GCA GGA TTG CGG GTC GAG GCT GCG ATG GCC AGC AOC AGC 
leu val val ala met val leu ala gly leu arg val glu ala ala met ala ser thr ser 
123/41 153/51 

GGC CTG CGG CTG GTC GCC GCG CGC GOG GAA ATG ATA CCC GCG ATC ACG AAA TAC ATG TCG 
gly leu arg leu val ala ala arg ala glu met ile pro ala ile thr lys tyr met ser 
183/61 213/71 

GCG CTG GAC GTC GCC GTG CTG GCC AGC TCG ACC GGA CAC GAT GTG GAG GGG GCG CAG AAA 
ala leu asp val ala val leu ala ser ser thr gly his asp val giu gly ala qln Ivs 
243/81 273/91 

AAC TTC ACC GCC CGC AAG TAC GAG CTG CAG ACG CGA CTG GCC GAC ACC GAC GTC ATC GCA 
asn phe thr ala arg lys tyr glu leu gin thr arg leu ala asp thr asp val ile ala 
303/101 333/111 

GAC GTG OGG TOG GGA GTG AAC ACG CTG CTC AAC GGC GGT CAG GCG CTG CTG GAT AAG ATG 
asp val arg ser gly val asn thr leu leu asn gly gly gin ala leu leu asp lys met 
363/121 

CTG GCC GAC AGC ATC GGC TTG CGG GAT C 
leu ala asp ser lie gly leu arg asp 



SEQ ID N° 21 
FIGURE 25C 



2767336 

64/73 

DE21.strider ~> 1-phase Translation 

DNA sequence 420 b.p. CTACGACAAGGC ... CACTACAAGATC linear 

1/1 31/11 

CTA CGA CAA GGC AAA GGA GCA CAG GGT GAA GCG TGG ACT GAC GGT CGC GGT AGC CGG AGC 
leu arg gin gly lys gly ala gin gly glu ala trp thr asp gly arg gly ser arg ser 
61/21 91/31 

CGC CAT TCT GGT CGC AGG TCT TTC CGG ATG TTC AAG CAA CAA GTC GAC TAC AGG AAG CGG 
arg his ser gly arg arg ser phe arg met phe lys gin gin val asp tyr arg lys arg 
121/41 151/51 

TGA GAC CAC GAC CGC GGC AGG CAC GAC GGC AAG CCC CGG CGC CGC ATC CGG GCC GAA GGT 
OPA asp his asp arg gly arg his asp gly lys pro arg arg arg lie arg ala glu gly 
181/61 211/71 

CGT CAT CGA CGG TAA GGA CCA GAA GGT CAC CGG GTC TGT GGT GTG CAC AAC CGC GGC CGG 
arg his arg arg OCH gly pro glu arg his arg val cys gly val his asn arg gly arq 
241/81 271/91 

CAA TGT CAA CAT CGC GAT CGG CGG GGC GGC GAC CGG CAT TGC CGC CGT GCT CAC CGA CGG 
gin cys gin his arg asp arg arg gly gly asp arg his cys arg arg ala his arq arq 
301/101 33l/m * 

CAA CCC TCC GGA GGT GAA GTC CGT TGG GCT CGG TAA CGT CAA CGG CGT CAC GCT GGG ATA 
gin pro ser gly gly gl u val arg trp ala arg OCH arg gin arg arg his ala gly He 
361/121 391/131 

CAC GTC GGG CAC CGG ACA GGG TAA CGC TOG GCA ACC AAG GAC GGC AGC CAC TAC AAG ATC 
his val gly his arg thr gly OCH arg ser ala thr lys asp gly ser his tyr lys He 



SEQ ID N° 22 
FIGURE 26A 



2767336 

65/73 

DE21,strider [2 to 420] -> 1-phasc Translation 

DMA sequence 420 b.p. CTACGACAAGGC ... CACTACAAGATC linear 

2/1 32/11 - 

TAC GAC AAG GCA AAG GAG CAC AGG GTG AAG CGT GGA CTG ACG GTC GCG GTA GCC GGA GCC 
tyr asp lys ala lys glu his arg val lys arg gly leu thr val ala val ala gly ala 
62/21 92/31 

GCC ATT CTG GTC GCA GGT CTT TCC GGA TGT TCA AGC AAC AAG TOG ACT ACA GGA AGC GGT 
ala ile leu val ala gly leu ser gly cys ser ser asn lys ser thr thr gly ser gly 
122/41 152/51 

GAG ACC flCG ACC GCG GCA GGC ACG ACG GCA AGC CCC GGC GCC GCA TCC GGG OCG AAG GTC 
glu thr thr thr ala ala gly thr thr ala ser pro gly ala ala ser gly pro lys val 
182/61 212/71 

GTC ATC GAC GGT AAG GAC CAG AAC GTC ACC GGG TCT GTG GTG TGC ACA ACC GCG GGC GGC 
val lie asp gly lys asp gin asn val thr gly ser val val cys thr thr ala ala gly 
242/81 272/91 

AAT GTC AAC ATC GCG ATC GGC GGG GCG GCG ACC GGC ATT GCC GCC GTG CTC ACC GAC GGC 
asn val asn ile ala lie gly gly ala ala thr gly lie ala ala val leu thr asp gly 
302/101 332/111 

AAC CCT COG GAG GTG AAG TCC CTT GGG CTC GGT AAC GTC AAC GGC GTC ACG CTG GGA TAC 
asn pro pro glu val lys ser val gly leu gly asn val asn gly val thr leu gly tyr 
362/121 392/131 

ACG TCG GGC ACC GGA CAG GGT AAC CCT CGG CAA CCA AGG ACG GCA GCC ACT ACA AGA TC 
thr ser gly thr gly gin gly asn ala arg gin pro arg thr ala ala thr thr arg 



SEQ ID N° 22 



FIGURE 26B 



66/73 2767336 

DE21.strider [3 to 420] -> 1- phase Translation 

DMA sequence 420 b.p. CTACGACAAGGC ... CACTACAAGATC linear 

3/1 33/11 

ACG ACA AGG CAA AGG AGC ACA GGG TGA AGC GTG GAC TGA CGG TOG CGG TAG CCG GAG CCG 
thr thr arg gin arg ser thr gly OPA ser val asp OPA arg ser arg AMB pro glu pro 
$3/21 93/31 

CCA TTC TGG TOG CAG GTC TTT CCG GAT GTT CAA GCA ACA AGT CGA CTA CAG GAA GCG GTG 
pro phe trp ser gin val phe pro asp val gin a la thr ser arg leu gin glu a la val 
123/41 153/51 

AGA CCA CGA COG CGG CAG GCA CGA CGG CAA GCC CCG GCG CCG CAT CCG GGC CGA AGG TCG 
arg pro arg pro arg gin ala arg arg gin ala pro ala pro his pro gly arg arg ser 
183/61 213/71 

TCA TCG ACG GTA AGG ACC AGA ACG TCA CCG GGT CTG TGG TGT GCA CAA CCG CGG CCG GCA 
ser ser thr val arg thr arg thr ser pro gly leu trp cys ala gin pro arg pro ala 
243/81 273/91 

ATG TCA ACA TCG CGA TCG GCG GGG CGG CGA CCG GCA TTG CCG COG TGC TCA CCG ACG GCA 
met ser thr ser arg ser ala gly arg arg pro ala leu pro pro cys ser pro thr ala 
303/101 333/111 

ACC CTC OGG AGG TGA AGT CCG TTG GGC TCG GTA ACG TCA ACG GCG TCA CGC TGG GAT ACA 
thr leu arg arg OPA ser pro leu gly ser val thr ser thr ala ser arg trp asp thr 
363/121 393/131 

CGT CGG GCA CCG GAC AGG GTA ACG CTC GGC AAC CAA GGA CGG CAG CCA CTA CAA GAT C 
arg arg ala pro asp arg val thr leu gly asn gin gly arg gin pro leu gin asp 



SEQ ID N° 22 
FIGURE 26C 



67/73 2767336 

DE22,stridcr -> 1- phase Translation 

DMA sequence 597 b.p. GCACAACCGCGG . . . OVCTACAAGATC linear 



VI 31/U 

GCA CAA CCG CGG CCG GCA ATG TCA ACA TCG CGA TCG GCG GGG CGG CGA CCG GCA TIG CCG 
ala gin pro arg pro ala met ser thr ser arg ser ala gly arg arg pro ala leu pro 
61/21 91/31 

OCG TGC TCA COG AOG GCA ACC CTC CGG AGG TGA ACT CCG TTG GGC TCG GTA ACG TCA ACG 
pro cys ser pro thr ala thr leu arg arg OPA ser pro leu gly ser val thr ser thr 
m /41 151/51 

GCG TCA OGC TGG GAT ACA CGT CGG GCA CCG GAC AGG GTA ACG CCT CGG CAA CCA AGG ACG 

?i?,f? r 3SP arg arg ala pro M P ar 9 val thr pro arg gin pro arg thr 

181/61 211/71 



V 1 _ 31/U 

CGA TC 
arg se 
91/31 
TGA AG 
OPA se 
151/51 
GAC AGG 
asp arg 
211/71 

GCA GCC ACT ACA AGA TCA CAG GGT GAA GCG TGG ACT GAC GGT CGC GGT AGC CGG AGC CGC 

S-?^* ^ ar9 Ser 9ln gIy glu ala ^ ^ asP arg gly ser arg ser arg 
241/81 271/91 

CAT TCT GGT CGC AGG TCT TTC CGG ATG TTC AAG CAA CAA GTC GAC TAC AGG AAG CGG TGA 

9 Y arg ^ phe arg met phe lv3 9ln gin val asp tyr arg lys arg OPA 
301/101 331/111 

GAC CAC GAC CGC GGC AGG CAC GAC GGC AAG OCC CGG CGC OGC TOC GGG CCG AAG GTC GTC 

aSP 3X9 9ly 3X9 hiS aSp 9ly lys pro arg ar * ar 9 9lY pro lys val val 
36V121 391/131 

ATC GAC GGT AAG GAC CAG AAC GTC ACC GGC ICC GTG GTG TGC ACA ACC GCG GCC GGC AAT 

!ow a !f 9 y lyS aSP 9ln asn Val gly ^ val val CV3 «*r thr ala ala gly asn 
421/141 451/151 

GTC AAC ATC GCG ATC GGC GGG GCG GCG ACC GGC ATT GCC GCC GTG CTC ACC GAC GGC AAC 

,ow a f? Ue 9ly 9ly ala ala thr * lv lle ala ala va * leu thr asp gly asn 

481/161 511/171 

CCT CCG GAG GTG AAG TOC GTT GGG CTC GGT AAC GTC AAC GGC GTC ACG CTG GGA TAC ACG 

L r ?,?^? 9 Val lyS Ser Val 9ly leu gly 330 val aan 9ly val thr leu gly tyr thr 
541/181 571/191 

TCG GGC ACC GGA CAG GGT AAC GCC TCG GCA ACC AAG GAC GGC AGC CAC TAC AAG ATC 
ser gly thr gly gin gly asn ala ser ala thr lys asp gly ser his tyr lys Ue 



SEQ ID N° 23 
FIGURE 27A 



68/73 2767336 

DE2Zstridcr [2 to 597] -> 1-phase Translation 

DNA sequence 597 b.p. GCACAACCGOGG ... CACTACAAGATC linear 

VI 32/11 

CAC AAC CGC GGC CGG CAA TGT CAA CAT CGC GAT CGG CGG GGC GGC GAC CGC CAT TGC CGC 
his asn arg gly arg gin cys gin his arg asp arg arg gly gly asp arg his cys arg 
62/21 92/31 

CGT GCT CAC CGA CGG CAA CCC TCC GGA GGT GAA GTC CGT TGG GCT CGG TAA OGT CAA CGG 
arg ala his arg arg gin pro ser gly gly glu val arg txp ala arg OCH arg gin arg 
122/41 152/51 

CGT CAC GCT GGG ATA CAC GTC GGG CAC CGG ACA GGG TAA CGC CTC GGC AAC CAA GGA CGG 
arg his ala gly ile his val gly his arg thr gly OCH arg leu gly asn gin gly arg 
182/61 212/71 

CAG CCA CTA CAA GAT CAC AGG GTG AAG CGT GGA CTG ACG GTC GOG GTA GCC GGA GCC GCC 
gin pro leu gin asp his arg val lys arg gly leu thr val ala val ala qly ala ala 
242/81 272/9! 

ATT CTG GTC GCA GGT CTT TCC GGA TGT TCA AGC AAC AAG TCG ACT ACA GGA AGC GGT GAG 
ile leu val ala gly leu ser gly cys ser ser asn lys ser thr thr gly ser gly glu 
302/101 332/111 
ACCACGACCGCGGCAGGCACGATCGCAAGCCCCGGCGCCG^ 

thr thr thr ala ala gly thr thr ala ser pro gly ala ala pro gly arg arg ser ser 
362/121 392/131 

TCG ACG GTA AGG ACC AGA ACG TCA CCG GCT OCG TGG TGT GCA CAA CCG CGG CCG GCA ATG 
ser thr val arg thr arg thr ser pro ala pro trp cys ala gin pro arg pro ala met 
422/141 452/151 

TCA ACA TCG CGA TCG GCG GGG CGG CGA CCG GCA TTG CCG CCG TGC TCA CCG ACG GCA ACC 
ser thr ser arg ser ala gly arg arg pro ala leu pro pro cys ser pro thr ala thr 
482/161 512/171 

CTC CGG AGG TGA AGT CCG TTG GGC TCG GTA ACG TCA ACG GCG TCA CGC TGG GAT ACA CGT 
leu arg arg OPA ser pro leu gly ser val thr ser thr ala ser arg trp asp thr arg 
542/181 572/191 

CGG GCA CCG GAC AGG GTA ACG CCT CGG CAA OCA AGG ACG GCA GCC ACT ACA AGA TC 
arg ala pro asp arg val thr pro arg gin pro arg thr ala ala thr thr arg 



SEQ ID N° 23 



FIGURE 27B 



69/73 

DE22^tridcr [3 to 597] -> 1-phasc Translation 

DNA sequence 597 b.p. GCACAACCGCGG . .. CACTACAAGATC linear 



2767336 



3/1 33/11 
ACA ACC GCG GCC GGC AAT GTC AAC ATC GCG ATC GGC GGG GCG 
thr thr ala ala gly asn val asn lie ala ile gly gly ala 
63/21 93/31 
GTG CTC ACC GAC GGC AAC OCT CCG GAG GTG AAG TCC GTT GGG 
val leu thr asp gly asn pro pro glu val lys ser val gly 
123/41 153/51 
GTC ACG CTG GGA TAG ACG TCG GGC ACC GGA CAG GGT AAC GCC 
val thr leu gly tyr thr ser gly thr gly gin gly asn ala 
183/61 213/71 
AGC CAC TAG AAG ATC ACA GGG TGA AGC GTG GAC TGA CGG TOG 
ser his tyr lys lie thr gly OPA ser val asp OPA arg ser 
243/81 273/91 
TTC TGG TCG CAG GTC TTT CCG GAT GTT CAA GCA ACA AGT CGA 
phe trp ser gin val phe pro asp val gin ala thr ser arg 
303/101 333/111 
CCA CGA COG CGG CAG GCA CGA CGG CAA GCC CCG GCG CCG CTC 
pro arg pro arg gin ala arg arg gin ala pro ala pro leu 
363/121 393/131 
CGA CGG TAA GGA CCA GAA OCT CAC CGG CTC CGT GGT GTG CAC 
arg arg OCH gly pro glu arg his arg leu arg gly val his 
423/141 453/151 
CAA CAT CGC GAT CGG CGG GGC GGC GAC CGG CAT TGC CGC CGT 
gin hi 3 arg asp arg arg gly gly asp arg his cys arg arg 
483/161 513/171 
TCC GGA GGT GAA GTC CGT TGG GCT CGG TAA CGT CAA CGG CGT 
ser gly gly glu val arg trp ala arg OCH arg gin arg arg 
543/181 573/191 
GGG CAC CGG ACA GGG TAA CGC CTC GGC AAC CAA GGA CGG CAG 
gly his arg thr gly OCH arg leu gly asn gin gly arg gin 



GCG ACC GGC 
ala thr gly 

CTC GGT AAC 
leu gly asn 

TCG GCA ACC 
ser ala thr 

CGG TAG CCG 
arg AMB pro 

CTA CAG GAA 
leu gin glu 

CGG GCC GAA 
arg ala glu 

AAC CGC GGC 
asn arg gly 

GCT CAC CGA 
ala his arg 

CAC GCT GGG 
his ala gly 

CCA CTA CAA 
pro leu gin 



ATT GCC GCC 
lie ala ala 

GTC AAC GGC 
val asn gly 

AAG GAC GGC 
lys asp gly 

GAG COG CCA 
glu pro pro 

GCG GTG AGA 
ala val arg 

GGT CGT CAT 
gly arg his 

CGG CAA TGT 
arg gin cys 

CGG CAA CCC 
arg gin pro 

ATA CAC GTC 
lie his val 

GAT C 
asp 



SEQ ID N° 23 



FIGURE 27C 



70/73 2767336 

DE23.strider -> 1-phase Translation 

DNA sequence 420 b.p. CTAACGACAGGC ... CACTACAAGATC linear 

VI 31/11 

CTA ACG ACA GGC AAA GGA GCA CAG GGT GAA GCG TGG ACT GAC GGT CGC GGT AGC CGG AGC 
leu thr thr gly lys gly ala gin gly glu ala trp thr asp gly arg gly ser arg ser 
61/21 91/31 

CGC CAT TCT GGT CGC AGG TCT TTC CGG ATG TPC AAG CAA CAA GTC GAC TAC AGG AAG CGG 
arg his ser gly arg arg ser phe arg met phe lys gin gin val asp tyr arg lys arg 
121 /41 151/51 

TGA GAC CAC GAC CGC GGC AGG CAC GAC GGC AAG CCC CGG CGC CGC TCC GGG CCG AAG GTC 
OPA asp his asp arg gly arg his asp gly lys pro arg arg arg ser gly pro lys val 
181/61 211/71 

GTC ATC GAC GGT AAG GAC CAG AAC GTC ACC GGC TCC GTG GTG TGC ACA ACC GCG GCC GGC 
val lie asp gly lys asp gin asn val thr gly ser val val cys thr thr ala ala cly 
241/81 271/91 

AAT GTC AAC ATC GCG ATC GGC GGG GCG GCG ACC GGC ATT GCC GCC GTG CTC ACC GAC GGC 

aSn Ale ala ile gly * ly ala ala 9ly He ala ala val leu thr asp gly 
301/101 331/111 

AAC OCT CCG GAG GTG AAG TOC GTT GGG CTC GGT AAC GTC AAC GGC GTC ACG CTG GGA TAC 

Pr ° 9lU Val lyS Ser Val gly leu ««n val asn gly val thr leu gly tyr 
361/121 391/131 

ACG TCG GGC ACC GGA CAG GGT AAC GCC TOG GCA ACC AAG GAC GGC AGC CAC TAC AAG ATC 
thr ser gly thr gly gin gly asn ala ser ala thr lys asp gly ser his tyr lys ile 



SEQ ID N° 24 
FIGURE 28A 



71/73 2767336 

DE23.strider [2 to 420] -> 1-phase Translation 

DNA sequence 420 b.p. CTAACGACAGGC ... CACTACAAGATC linear 

VI 32/11 

TAA CGA CAG GCA AAG GAG CAC AGG GTG AAG CGT GGA CTG ACG GTC GCG GTA GCC GGA GCC 
OCH arg gin ala lys glu his arg val lys arg gly leu thr val ala val ala gly ala 
62/21 92/31 

GCC ATT CTG GTC GCA GGT CTT TCC GGA TGT TCA AGC AAC AAG TOG ACT ACA GGA AGC GGT 
ala lie leu val ala gly leu ser gly cys ser ser asn lys ser thr thr qly ser alv 
122/41 XS2/51 y y 

GAG ACC ACG ACC GCG GCA GGC ACG ACG GCA AGC CCC GGC GCC GCT COG GCC GGA AGG TCG 
glu thr thr thr ala ala gly thr thr ala ser pro gly ala ala pro gly arg arg ser 
182/61 212/71 

TCA TCG ACG GTA AGG ACC AGA ACG TCA COG GCT CCG TGG TGT GCA CAA CCG CGG COG GCA 
ser ser thr val arg thr arg thr ser pro ala pro trp cys ala gin pro arg pro ala 
242/81 272/91 

ATG TCA ACA TCG CGA TCG GCG GGG CGG CGA CCG GCA TTG CCG CCG TGC TCA CCG ACG GCA 
met ser thr ser arg ser ala gly arg arg pro ala leu pro pro cys ser pro thr ala 
302/101 332/U1 

ACC CTC CGG AGG TGA AGT CCG TTG GGC TCG GTA ACG TCA ACG GCG TCA CGC TGG GAT ACA 
thr leu arg arg OPA ser pro leu gly ser val thr ser thr ala ser arg trp asp thr 
362/121 392/131 

CGT CGG GCA COG GAC AGG GTA ACG CCT CGG CAA CCA AGG ACG GCA GCC ACT ACA AGA TC 
arg arg ala pro asp arg val thr pro arg gin pro arg thr ala ala thr thr arg 



SEQ ID H° 24 



FIGURE 28B 



72/73 



2767336 



DE23.strider [3 to 420) -> 1-phase Translation 

DHA sequence 420 b.p. CTAACGACAGGC ... CACTACAAGATC linear 



3/1 
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GAG 


CCG 




arg 


gjLfi airg ser tnr yi.y 




ser 


val asp OPA 


arg ser 


arg 


AMB 


pro 


glu 


pro 


63/21 


























TOG CAG GTC TTT CCG 


GAT 


GTT 


CAA GCA ACA 


AGT CGA 


CTA 


CAG 


GAA 


GCG 


GTG 


IT r 


t-rn 
cxp 


ser gin vai pne pro 


asp 


vai 


gin ala thr 


ser arg 


leu 


gin 


glu 


ala 


val 


123/41 










13J/D1 














ov>A iA^A 




CCG CGG CAG GCA CGA 


CGG 


CAA 


GCC CCG GCG 


CCG CTC 


CGG 


GCC 


GAA 


GGT 


CGT 


ara pro 


ara 


pro arg gin ala arg 


arg 


gin 


QXQ f.LV ulu 






ala 


glu 


gly 


arg 


183/61 










213/71 














CAT CGA 


CGG 


TAA GGA CCA GAA CGT 


CAC 


CGG 


CTC CGT GGT 


GTG CAC 


AAC 


CGC 


GGC 


CGG 


CAA 


his arg 


arg 


OCH gly pro glu arg 


his 


arg 


leu arg gly 


val his 


asn 


arg 


gly 


arg 


gin 


243/81 










273/91 










TGT CAA 


CAT 


CGC GAT CGG CGG GGC 


GGC 


GAC 


CGG CAT TCC 


CGC CGT 


GCT 


CAC 


CGA 


CGG 


CAA 


cys gin 


his 


arg asp arg arg gly 


gly 


asp 


arg his cys 


arg arg 


ala 


his 


arg 


arg 


gin 


303/101 










333/111 










CCC TCC 


GGA 


GGT GAA GTC OGT TGG 


GCT 


CGG 


TAA CGT CAA 


CGG CGT 


CAC 


GCT 


GGG 


ATA 


CAC 


pro ser 


gly 


gly glu val arg trp 


ala 


arg 


OCH arg gin 


arg arg 


his 


ala 


gly 


lie 


his 


363/121 










393/131 














GTC GGG 


CAC 


CGG ACA GGG TAA CGC 


CTC 


GGC 


AAC CAA GGA 


CGG CAG 


CCA 


CTA 


CAA 


GAT 


c 


val gly 


his 


arg thr gly OCH arg 


leu 


gly 


asn gin gly 


arg gin 


pro 


leu 


gin 


asp 





SEQ ID N° 24 
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2767336 



SEQ ID N° 25 
Amorce directe 
5' ACG CGG CGC AGC CTG TTG 3' 

SEQ ID N° 26 
Amorce inverse 
5' CGA CCT TGG GAT TCG CCT 3' 
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